Что такое хранилище данных?
Согласно Википедии, хранилище данных это:
В цифровой индустрии, хранилище данных (DW или DWH), также известное как хранилище данных предприятия (EDW), представляет собой систему, используемую для отчетности и анализа данных. DW являются центральными хранилищами интегрированных данных из одного или нескольких разрозненных источников. Они хранят текущие и исторические данные и используются для создания аналитических отчетов для работников умственного труда на предприятии. Примеры отчетов могут варьироваться от ежегодных и квартальных сравнений и трендов до подробных ежедневных анализов продаж. Данные, расположенные в хранилище, загружаются из операционных систем (например, маркетинг, продажи и т. д., показанные на рисунке внизу). Данные могут проходить через хранилище оперативных данных для дополнительных операций до того, как они будут использоваться в DW для отчетности. |
В начале девяностых Билл Инмон придумал термин хранилище данных, определяя его, как:
Предметно-ориентированное, интегрированное, привязанное ко времени, неизменяемое скопление данных для поддержки решений руководства. |
С другой стороны, Ральф Кимбалл более емко определяет хранилище данных, как:
Копия транзакционных данных, структурированных специально для запроса и анализа. |
Ральф Кимбалл раскрывает определение с помощью требований:
- Хранилище данных обеспечивает доступ к корпоративным или организационным данным.
- Данные в хранилище согласованы.
- Данные в хранилище можно разделить и объединить с помощью всех возможных мер в бизнесе (требование классического "анализа вдоль и попёрек"),
- Хранилище данных - это не просто данные, но также набор инструментов для запроса, анализа и представления информации.
- Хранилище данных - это место, где мы публикуем используемые данные.
- Качество данных в хранилище данных является драйвером реинжиниринга бизнеса.
Согласно Википедии, витрина данных:
Витрина данных - срез хранилища данных, представляющий собой массив тематической, узконаправленной информации, ориентированный, например, на пользователей одной рабочей группы или департамента. Витрины данных представляют собой небольшие фрагменты хранилища данных. В то время как хранилища данных имеют глубину всего предприятия, информация в витринах данных относится к одному отделу. В некоторых развертываниях каждый отдел или подразделение считается владельцем своего хранилища данных, включая все оборудование, программное обеспечение и данные. Это позволяет каждому подразделению использовать, манипулировать и разрабатывать свои данные по своему усмотрению; без изменения информации внутри других витрин данных или хранилища данных. В других вариантах развертывания, в которых используются соответствующие измерения, это право собственности на бизнес-единицы не распространяется на общие параметры, такие как клиент, продукт и т.д. |