Интересно, этот вопрос еще не задавался. У Google очень мало результатов, которые не показывают высококачественный инструмент
Какие есть решения с открытым исходным кодом (также бесплатно в порядке) для хранилищ данных и, в частности, инструменты бизнес-аналитики? Каковы ваши переживания с ними. У меня был курс по моей магистерской программе, и мы работали с MS Business Intelligence и MSSQL в качестве хранилища данных. Теперь я хочу больше узнать об этой теме с помощью «открытых» инструментов.
Существуют ли сопоставимые инструменты для бизнес-аналитики (в основном независимые от баз данных), и есть ли у вас опыт их использования?
править С комментарием Мэриан к ответу Стефани, я вижу , что я сформулировал вопрос неправильно. Я знаю, что DWH - это просто «оптимизированные для отчетности» базы данных, объяснение Стефани было очень ясным по этому поводу. Меня больше интересует, как преобразовать данные в такие оптимизированные формы с помощью ПО какого типа / программного обеспечения / других методов BI.
Ответы:
Я работаю с Pentaho уже около года.
Pentaho - это полный пакет с открытым исходным кодом для бизнес-аналитики.
Сила в том, что он опирается на независимо управляемый проект:
Вы можете использовать их целиком (Pentaho BI Server) или отдельно.
Почему я рекомендую это? Сообщество действительно активно и предоставляет плагины на еженедельной основе. Группа членов сообщества предоставила основу для создания интерактивной панели инструментов с помощью интерфейса click & go.
Это не зависит от базы данных. Если у вас есть свободное время, просто посмотрите на него.
Я провел исследование, прежде чем использовать Pentaho, я тестировал IceCube и Palo, даже JasperSoft, но Pentaho был намного лучше в соответствии с моими потребностями.
источник
Я думаю, вы не понимаете, что подразумевается под хранилищем данных . Это не инструмент. Или приложение. Или база данных. Это не значит «большая база данных».
Вы сказали,
MSSQL не только для хранения ГБДА, она является ГБДОМ.
Хранилище данных - это база данных, специально разработанная и оптимизированная для отчетности. Вы не регистрируете транзакции против этого.
Вы можете использовать практически любой BI-инструмент против этого DWH. Но инструмент BI - это не DWH.
Любая СУБД может быть использована. Некоторые будут лучше управлять размером. Разделение на части и соединения типа «звезда» являются примерами функций в СУБД, которые улучшают очень большие хранилища данных, но они не требуются.
Кубы обычно создаются из хранилища данных и используются для быстрого нарезания и нарезки кубиков различных уровней агрегации по различным измерениям.
Используйте любую СУБД, которую вы хотите. Понимание размерного моделирования - настоящая дискуссия.
источник