В чем разница между базой данных и хранилищем данных?

163

В чем разница между базой данных и хранилищем данных?

Разве они не одно и то же или, по крайней мере, написаны в одном и том же (т.е. Oracle RDBMS)?

Data Man
источник

Ответы:

147

Проверьте это для получения дополнительной информации.

Из предыдущей ссылки:

База данных

  1. Используется для оперативной обработки транзакций ( OLTP ), но может использоваться для других целей, таких как хранилище данных. Это записывает данные от пользователя для истории.
  2. Таблицы и объединения сложны, поскольку они нормализованы (для RDMS ). Это сделано для уменьшения избыточных данных и экономии места на диске.
  3. Entity - для проектирования базы данных RDMS используются методы реляционного моделирования.
  4. Оптимизирован для операции записи.
  5. Производительность низкая для анализа запросов.

Хранилище данных

  1. Используется для онлайн-аналитической обработки ( OLAP ). Это читает исторические данные для пользователей для бизнес-решений.
  2. Таблицы и объединения просты, так как они не нормализованы. Это сделано для того, чтобы сократить время ответа на аналитические запросы.
  3. Методы моделирования данных используются для проектирования хранилища данных.
  4. Оптимизирован для операций чтения.
  5. Высокая производительность для аналитических запросов.
  6. Есть , как правило , базы данных.

Также важно отметить, что хранилища данных могут быть получены от нуля до многих баз данных.

TheCloudlessSky
источник
3
Моделирование данных - это общий термин, который применяется не только к хранилищам данных. (Возможно, во втором # 3 они имели в виду «многомерное моделирование», так как, по моему опыту, это самый популярный способ их построения.) Последняя строка не имеет смысла: как хранилище данных «содержит» базу данных? Я мог бы сказать, что хранилище данных поставляется от 0 до многих (OLTP) баз данных.
Патрик Маршан
2
@Mark - Где говорится, что базы данных ТОЛЬКО для OLTP? Он показывает, как базы данных связаны с хранилищами данных.
TheCloudlessSky
5
@ Николай - это двухлетний ответ. Отредактируйте это и исправьте это, если вы обеспокоены.
TheCloudlessSky
1
@ DataMan - пометить это как правильный ответ. это довольно хороший и справедливый ответ на ваш вопрос.
sanzy
1
В чем разница между методами моделирования данных и сущностями реляционного моделирования?
QAIS
32

С нетехнической точки зрения: база данных ограничена определенными приложениями или набором приложений.

Хранилище данных - это хранилище данных уровня предприятия. Он будет содержать данные из всех / многих сегментов бизнеса. Он собирается поделиться этой информацией, чтобы обеспечить глобальную картину бизнеса. Это также важно для интеграции между различными сегментами бизнеса.

С технической точки зрения: слово «Хранилище данных» не имеет признанного определения. Лично я определяю хранилище данных как набор витрин данных. Где каждый витрина данных состоит из одной или нескольких баз данных, где база данных специфична для определенного набора проблем (приложения, набора данных или процесса).

Проще говоря, база данных является компонентом хранилища данных. Есть много мест, где можно исследовать эту концепцию, но поскольку нет «определения», вы найдете проблемы с любым ответом, который вы дадите.

Markus
источник
Datamart предпочтительно является базой данных OLTP?
CᴴᴀZ
@ CᴴᴀZ для чего? Datamart созданы для OLAP, Datamart - это в основном маленький DWH (для небольшой части бизнеса). он создан для анализа, поэтому, если вам нужна система OLTP, Datamart не является вашим выбором, если вам нужна модель данных для анализа (схема запуска или поток Snow), то вы бы предпочли Datamart.
Энрике Бенито Касадо
Привет @ Энрике, получил твое мнение: Datamart вносит свой вклад в OLAP. Я взял пример того, что Datamarts - это OLTP - SQL Server OLTP Datamart .
CᴴᴀZ
Привет @ CᴴᴀZ, я прочитал статью, и было бы просто, как сделать OLTP с помощью Datamart. хорошо . (но я думаю, что они сказали это как исключение) Примите во внимание, что, как они говорят, таблицы OLTP должны быть нормализованы, чтобы не было несоответствий. нормализацию не так сложно сделать в схеме ER, но она гораздо сложнее для схем Star-Schema или Snow-Flow. Эти схемы созданы для облегчения чтения в базе данных, а не для транзакционных операций. Вот почему использование Datamart, такого как OLTP, не должно быть хорошей идеей, даже если это возможно.
Энрике Бенито Касадо
16

Хранилище данных - это ТИП базы данных.

В дополнение к тому, что люди уже сказали, хранилища данных, как правило, представляют собой OLAP, с индексами и т. Д., Настроенными для чтения, а не записи, и данные нормализуются / преобразуются в формы, которые легче читать и анализировать.

Некоторые люди говорят, что «базы данных» такие же, как OLTP - это не так. OLTP, опять же, это ТИП базы данных.

Другие типы «баз данных»: текстовые файлы, XML, Excel, CSV ..., плоские файлы :-)

Дейв
источник
1
Это правильный ответ для них всех. И немного о Datamart:It is a logical subset of Data warehouse, generally based upon business functions.
CᴴᴀZ
7

Самый простой способ объяснить это - сказать, что хранилище данных состоит не только из базы данных. База данных - это набор данных, организованных каким-либо образом, но хранилище данных организовано специально для «облегчения отчетности и анализа». Это, однако, не вся история, поскольку хранилище данных также содержит «средства для извлечения и анализа данных, для извлечения, преобразования и загрузки данных, а также для управления словарем данных, также считаются важными компонентами системы хранилища данных».

Хранилище данных

kniemczak
источник
4

База данных : - OLTP (процесс онлайн транзакций)

  • Это текущие данные, последние подробные данные, плоские реляционные изолированные данные.
  • Отношения сущностей используются для проектирования базы данных
  • Размер БД 100 МБ-ГБ, простая транзакция или запрос

Datawarehouse

  • OLAP (Аналитический онлайн-процесс)
  • Речь идет об исторических данных Схема звезды, схема сгиба снега и галактика
  • схема используется для проектирования хранилища данных
  • Размер БД 100 ГБ-ТБ Улучшенная основа производительности запросов для минимизации данных Визуализация данных
  • Позволяет пользователям получить более глубокое понимание и знание различных аспектов своих корпоративных данных благодаря быстрому, согласованному, интерактивному доступу к широкому спектру возможных представлений данных.
Рамя Анкишетти
источник
4

Хранилище данных и база данных. Хранилище данных специально разработано для анализа данных, которое включает в себя чтение больших объемов данных, чтобы понять взаимосвязи и тенденции в данных. База данных используется для сбора и хранения данных, таких как запись деталей транзакции.

Хранилище данных: подходящие рабочие нагрузки - аналитика, отчетность, большие данные. Источник данных - данные, собранные и нормализованные из многих источников. Сбор данных - Операции с массовой записью, как правило, по заранее заданному расписанию. Нормализация данных - денормализованные схемы, такие как схема Star или схема Snowflake. Хранение данных - оптимизировано для простоты доступа и высокоскоростного запроса. производительность с использованием столбчатого хранилища. Доступ к данным - оптимизирован для минимизации ввода-вывода и максимизации пропускной способности.

База данных транзакций: Подходящие рабочие нагрузки - Обработка транзакций. Источник данных - данные, полученные как есть, из одного источника, такого как транзакционная система. Сбор данных - Оптимизирован для непрерывных операций записи, поскольку новые данные доступны для максимизации пропускной способности транзакций. Нормализация данных - Сильно нормализованные, статические схемы. Хранение данных - Оптимизировано для большого количества операций записи в один ориентированный на строки физический блок. Доступ к данным - большие объемы небольших операций чтения.

LarryH
источник
1

Любое хранилище данных для приложения обычно использует базу данных. Это может быть реляционная база данных или нет базы данных sql, которые в настоящее время находятся в тренде.

Хранилище данных также является базой данных. Мы можем назвать базу данных хранилища данных как специализированное хранилище данных для целей аналитической отчетности для компании. Эти данные используются для ключевых бизнес-решений.

Упорядоченные данные помогают эффективно составлять отчеты и принимать деловые решения.

Рама Кришна
источник
1

База данных:

Используется для оперативной обработки транзакций (OLTP).

  • Ориентированных на транзакции.
  • Приложение ориентировано.
  • Текущие данные.
  • Подробные данные.
  • Масштабируемые данные.
  • Многие пользователи, администраторы / оперативные.
  • Время исполнения: короткое.

Хранилище данных:

Используется для онлайн-аналитической обработки (OLAP).

  • Ориентированный анализ.
  • Предметно-ориентированный.
  • Исторические данные.
  • Агрегированные данные.
  • Статические данные.
  • Не много пользователей, менеджер.
  • Время исполнения: долго.
Abderrahmen
источник
1

Хранилище данных (DW) - это процесс сбора данных из различных источников и управления ими для обеспечения значимого понимания бизнеса. Хранилище данных обычно используется для подключения и анализа бизнес-данных из разнородных источников. Хранилище данных является ядром системы BI, которая построена для анализа данных и отчетности.

Харит Перера
источник
0

Источником для Хранилища данных может быть кластер баз данных, поскольку базы данных используются для процесса онлайн-транзакций, например, для хранения текущих записей. Но в Хранилище данных хранятся исторические данные, предназначенные для аналитического процесса в Интернете.

dgcharitha
источник
0

Хранилище данных - это тип структуры данных, обычно размещаемой в базе данных. Хранилище данных ссылается на модель данных и тип данных, которые там хранятся - данные, которые моделируются (модель данных) для аналитических целей сервера.

База данных может быть классифицирована как любая структура, которая содержит данные. Традиционно это будет СУБД, такая как Oracle, SQL Server или MySQL. Однако база данных также может быть базой данных NoSQL, такой как Apache Cassandra, или столбчатой ​​MPP, такой как AWS RedShift.

Вы видите, что база данных - это просто место для хранения данных; Хранилище данных - это особый способ хранения данных, который служит определенной цели, которая заключается в обслуживании аналитических запросов.

OLTP против OLAP не говорит вам разницы между DW и базой данных, и OLTP и OLAP находятся в базах данных. Они просто хранят данные по-разному (разные методологии модели данных) и служат разным целям (OLTP - записи транзакций, оптимизированные для обновлений; OLAP - анализ информации, оптимизированные для чтения).

Аакаш Рами
источник
-1

См. Простыми словами: информационное обеспечение -> огромные данные, используемые для аналитики / хранения / копирования и анализа. База данных -> операция CRUD с часто используемыми данными.

Dataware house - это тип хранилища, которым вы не пользуетесь ежедневно, а Database - это то, чем вы часто пользуетесь.

Например. Если мы просим выписку банка, то она дает нам за последние 3/4/6 / более месяцев, потому что она находится в базе данных. Если вы хотите больше, чем это хранит на Dataware House.

user7188680
источник
-1

Пример: дом стоит $100,000, и он ценится $1000за год.

Чтобы отслеживать текущую стоимость дома, вы должны использовать базу данных, поскольку значение будет меняться каждый год.

Через три года вы сможете увидеть стоимость дома, который $103,000.

Чтобы отслеживать историческую стоимость дома, вы должны использовать хранилище данных, так как стоимость дома должна быть

$100,000 on year 0, 
$101,000 on year 1, 
$102,000 on year 2, 
$103,000 on year 3. 
user3019766
источник