Размер и факт для одних и тех же объектов?

8

Я довольно новичок в разработке DW и работаю над DW для моделирования некоторой ИТ-инфраструктуры.

Основная проблема / вопрос на данный момент заключается в том, как моделировать информацию о диске.

Мы будем собирать совокупные данные о файлах и папках, а также отдельные данные на физических дисках. Информация о диске будет включать как минимум общее и свободное пространство и будет обновляться несколько раз в неделю.

Один из бизнес-вопросов, на который нужно будет ответить, - это тенденция использования дисков с течением времени. Информация о диске также будет использоваться в иерархии, ведущей к уровню файлов / папок.

Варианты, которые я вижу сейчас:

  1. Реализовать DRIVEкак измерение

    • Упрощает иерархический дизайн
    • Это вызовет проблемы с отчетностью? Мне кажется нелогичным сообщать ограниченные во времени данные только по измерению
    • Также кажется проблематичным иметь измерение, которое вы ЗНАЕТЕ будет меняться каждый раз, когда вы обновляете свои данные
  2. Реализуйте DRIVEкак таблицу фактов

    • Упрощает отчетность
    • Сложная иерархия (?) - я буду использовать Driveдля отображения данных на определенный сервер или компьютер. Можно ли использовать таблицу фактов в качестве промежуточного уровня в иерархии? Я не думаю, что это так.
  3. Реализуйте DRIVEкак факт и измерение

    • Факт будет содержать только ключ, дату и факты о пространстве
    • Измерение будет включать в себя другие неаддитивные данные, такие как компьютер и т. Д.
    • Кажется, чтобы решить обе проблемы, но это анти-шаблон?
JNK
источник

Ответы:

6

Я ожидаю, что у меня будет таблица фактов drive_usage со ссылкой на измерение времени снимка, измерение диска, измерение компьютера и различные числовые факты о диске в тот момент времени.

Вероятно, не должно быть ничего регулярно меняющегося в измерении диска - я думаю, это зависит от вашего определения диска - это физический диск или логическая единица или что. Возможно, у вашего диска "C" есть серийный номер, и он заменен - ​​тогда срок действия истекает, и добавляется новое измерение. Эти вещи об измерении на самом деле не являются «фактами», они являются атрибутами. Это не повлияет на отчеты, потому что данные для компьютера X, диск C имеет непрерывность. Точно так же, если компьютер X обновлен с двухъядерного на четырехъядерный, и, следовательно, происходит изменение в измерении (при условии, что что-то сверх числа ядер не отслеживается в таблице фактов, как в ревизии материнской платы). Емкость диска указана в таблице фактов, поэтому с течением времени изменения в ней - это просто новые факты с новыми датами. Иногда вы можете даже смоделировать изменения в членстве как факты. то есть если физические диски 1-5 находятся в логическом диске C один день, а затем физические диски 1-6 находятся в логическом диске C следующий, это может быть просто изменением фактов в таблице фактов членства физического диска. Это то, что некоторые люди называют таблицами фактов без фактов, поскольку единственным фактом является наличие строки, показывающей членство - ничего не нужно делать, кроме суммирования или подсчета.

Когда вы попадаете в папки, моделирование иерархии может быть намного сложнее, в зависимости от того, чего вы пытаетесь достичь с помощью накопительных пакетов.

DW-моделирование в областях, которые не являются заурядными сценариями, очень разнообразно.

Кейд Ру
источник