11.02.2020 16:00
Комментарии: 0
Просмотры: 460
«Газпром нефть» первой среди российских компаний внедрила комплексную аналитическую
платформу управления данными, сообщили Информационному агентству АИ 92 в пресс-службе компании.
Проект реализован в дирекции региональных продаж –
подразделении, отвечающим за сбыт моторных топлив.
«Умное озеро данных» включает компоненты обработки, хранения и анализа данных – Data lake и
хранилище данных, лабораторию продвинутой аналитики Data science, работающие в тесной
интеграции с компонентами Data Governance.
Внедрение аналитической платформы является частью стратегии цифровой трансформации
дирекции региональных продаж, где около 50% всех аналитических проектов и инициатив уже
реализуются в контуре «умного озера данных», а в 2020 году – их доля достигнет не менее 75%.
«Умное озеро данных» признано «Проектом года» IT-портала Global CIO в номинации
«Аналитические решения и Big Data».
Комплексное решение создает гибкую инфраструктуру для любых задач анализа и системного
улучшения качества данных, что позволяют бизнесу быстро разрабатывать и внедрять клиентские
решения и повышать операционную эффективность сбытового бизнеса. За счет централизации
обработки и хранения данных снижаются затраты на инфраструктуру и подготовку данных для
проектов компании. Сотрудники получают мгновенный доступ через единый пользовательский
портал к описаниям любых объектов и наборов данных. Компания может предугадывать
предпочтения клиентов и персонализировать предложения.
Первые задачи «умного озера» включили в себя обработку транзакций сети АЗС «Газпром нефть»,
расчет сегментов для клиентской аналитики, анализ обратной связи от клиентов. Кроме этого, в
платформу были интегрированы данные значительного числа внешних источников, в частности,
Санкт-Петербургской товарно-сырьевой биржи, сайтов Центробанков России и СНГ,
географические и метеорологические ресурсы, метрики и отзывы Google, App Store, «Яндекс»,
открытые данные социальных сетей, различные данные партнеров и сведения о конкурентах,
данные мобильных приложений.
«Мы создали комплексную инфраструктуру работы с данными, реализовав сложную
современную архитектуру Big Data. Для выполнения проекта был создан Центр аналитических
решений, включающий подразделения по инжинирингу данных и Центр компетенций по Data
science, создана «с нуля» сильная команда внутри и вся разработка проведена без привлечения
внешних подрядчиков. Мы уже видим эффект от внедрения «умного озера данных» в сокращении
затрат на поиск и поставку качественных данных для цифровых инициатив и проектов. Ожидаем,
что, благодаря активному использованию инструментов Data Governance в течение трех лет
повысим качество данных на 60%, что значительно снизит операционные риски и затраты
бизнеса», – отметил директор по региональным продажам ПАО «Газпром нефть» Александр
Крылов.
Ключевые для «умного озера данных» компоненты Data Governance реализованы на платформе
Informatica, которая является признанным мировым лидером решений для интеграции и
управления данными. Партнером по поставке и поддержке внедрения продуктов Informatica
выступила компания DIS Group, официальный представитель Informatica в России и СНГ.
СПРАВКА:
Data science – наука о методах анализа данных, сформировавшаяся на стыке математики,
компьютерных наук и бизнеса, включающая в себя построение сложных аналитических моделей
на основе данных для извлечения новых знаний.
Data Lake (озеро данных) – элемент инфраструктуры Big Data, хранилище большого объема
неструктурированной информации в интересах отдельной организации. Цель создания озер
данных – дать высококвалифицированным аналитикам возможность изучать неочищенные, не
агрегированные данные и применять к ним различные аналитические техники.
Компоненты Data Governance включают в себя: Систему управления качеством данных с
управлением и мониторингом бизнес-правилами; Систему управления метаданными: каталог
доступных источников, таблиц, витрин, моделей данных и отчетов, историю происхождения
данных; Бизнес-глоссарий – управляемый каталог используемых в отчетности и аналитике бизнес-
терминов; Пользовательский портал по данным: поиск объектов данных, владельцев, ролей,
наборов данных, просмотр актуальных цепочек происхождения и правил по качеству данных и
т.д.
Комментарии