Тренды BI 2019: управление данными сближается с современными платформами BI
Поскольку источники данных становятся все более сложными, разнообразными и многочисленными, управление данными в настоящее время становится еще более важным в современных развертываниях BI. Так как большая часть сотрудников использует данные для принятия решений, организации должны обеспечить точность своих данных и их использования в анализе.
Организации обратились к обработке данных, чтобы решить проблемы управления данными и управления, связанные с этим более широким доступом к данным. Курирование данных представляет собой способ, которым организация собирает, очищает, определяет и выравнивает разрозненные данные. Этот процесс создает мост между данными и их реальными приложениями.
Организации уже тратят миллионы долларов на технологии, которые объединяют определения данных с аналитическими инструментами, которые в свою очередь помогают анализировать данные, с целью устранения неоднозначности в группах и организациях. Со своей стороны, инструменты и процессы курирования данных (такие как каталоги данных и семантическое управление) объединяются с платформами BI, чтобы связать данные с бизнес-контекстом.
Каталог данных выступают в качестве корпоративного бизнес-глоссария источников данных и общих определений данных. Специалисты в данной области, такие как инженеры данных и управляющие данными, могут добавлять описания и определения к источникам данных и полям, помечать для лучшей возможности обнаружения и даже полезные показатели качества данных, включая уведомления для сертификации доверенного контента, а также обслуживания или устаревания активов данных.
Повседневные пользователи не должны знать, где данные расположены в источнике данных, но они должны понимать, что эти данные представляют в реальном мире. Например, аналитики и потребители контента часто должны проверять происхождение фрагмента данных (также называемого анализом происхождения). И если наборы данных изменяются, разработчики данных и управляющие данными должны проанализировать последующее влияние на активы, связанные с таблицами или схемами, которыми они управляют. Объединение каталога данных и платформы BI помогает упростить все эти задачи, предоставляя метрики использования для быстрого определения наиболее часто используемых источников данных и информационных панелей.
Каталоги данных могут иметь больше возможностей, чем управление метаданными в области семантического управления. Семантика помогает связать не только контекст данных, но и цель аналитических действий, таких как сопоставление синонимов для соединения таких команд, как «размер заказа» и «количество». Это обеспечивает новые способы взаимодействия всего спектра с работниками данных с данными. и быстро прийти к новым идеям. Одним из способов является взаимодействие на естественном языке, когда платформа BI понимает слои, которые включают несколько запросов, например «Выделите самый высокий, самый низкий и средний».
Поскольку эти технологии и процессы продолжают сближаться, обработка данных и семантика обеспечат более прочную основу для остальной части аналитического опыта. Это объединит более разрозненные компоненты экосистемы данных, такие как очистка и последующий анализ, и даст более сильные, сгенерированные машиной рекомендации для таблиц, объединений и моделей данных. В конечном счете, улучшения в области обработки данных позволят работникам не просто задавать вопросы своим данным во время анализа, а задавать вопросы относительно своего бизнеса.