В чем разница между федеративным и децентрализованным хранилищем данных?

9

Я не могу найти какие-либо четкие определения или объяснения любого из них. Оба кажутся децентрализованными. Похоже, что в Federated DWH данные распределены и не интегрированы в единый репозиторий и доступны из распределенных источников.

В то время как в Децентрализованной реализации DWH данные объединены в одно центральное хранилище.

Пожалуйста, объясните разницу между этими двумя реализациями.

LifeH2O
источник

Ответы:

6

Децентрализованное хранилище данных - это, по сути, совокупность хранилищ данных, поддерживаемых отдельными регионами или подразделениями, но доступными централизованно. Они могут находиться на одном физическом сервере, совместно использовать инструменты отчетности или быть доступными по всей организации другим способом. Также могут быть централизованные компоненты, такие как управление основными данными. Обычно это делается потому, что централизованные хранилища данных становятся громоздкими за пределами определенного размера организации. Хранилище данных должно реагировать на изменения, и если оно слишком не отвечает, то отдельные отделы начнут создавать свои собственные решения.

Это можно увидеть в инвестиционных банках, где тенденция состоит в том, чтобы создавать хранилища данных для удовлетворения конкретных требований (например, конкретной нормативной инициативы или некоторого вида финансовой отчетности), а не создавать централизованное хранилище для всего бизнеса. Компания размером с крупный банк просто слишком сложна, чтобы выполнить требования к полностью централизованному EDW за разумный промежуток времени.

Федеративное хранилище данных добавляет главный уровень консолидации в децентрализованные хранилища данных. Обычно это только узкий вертикальный срез данных, поскольку его целью является консолидация ключевых показателей по всему бизнесу для отчетности на уровне компании или группы, а не предоставление обобщенной платформы MI для всех отделов. Департаментам приходится создавать свои собственные системы EDW или MI, но они обязаны предоставлять наборы данных, необходимые для заполнения централизованного уровня консолидации.

Эта архитектура дает вам лучшее из обоих миров. Центральное руководство может видеть свои показатели по всей организации, а отделы могут организовать решения MI для удовлетворения своих потребностей. Центральному руководству нужно только навязать требования к данным, необходимые для их аналитики и MI в качестве каналов, предоставляемых системами департаментов. Если им требуется более глубокая отчетность или анализ по конкретному отделу, то это может быть обеспечено системами отделов.

В статье, приведенной ниже, более подробно рассматриваются федеративные хранилища данных.

http://www.zentut.com/data-warehouse/federated-data-warehouse-architecture/

В этой статье рассматриваются топологии хранилища данных более подробно.

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-1

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-2

ConcernedOfTunbridgeWells
источник
Таким образом, они оба децентрализованы, но объединены объединяют подмножество (ключевые метрики) в одном месте?
LifeH2O
Да. Это правильно. Имейте в виду, что эти определения весьма неформальны, поэтому люди могут использовать их по-разному. Мне никогда не приходилось создавать системы любого типа, хотя я однажды сделал предложение для федеративной архитектуры и увидел пару сайтов, на которых были системы, которые можно было бы охарактеризовать как децентрализованные по определениям, которые я использую.
ConcernedOfTunbridgeWells