«Национальная Лотерея» строит хранилище данных на продуктах Arenadata

Бренд всероссийских государственных лотерей «Национальная Лотерея» реализует проект по строительству нового хранилища данных. В его рамках он использует продукты Группы Arenadata — аналитическую MPP-СУБД Arenadata DB (ADB) и систему управления корпоративными данными Arenadata Catalog (ADС).

«Национальная Лотерея» строит хранилище данных на продуктах Arenadata
© РБК Компании

«Национальная Лотерея» исторически применяла несколько баз данных и имела множество различных источников, не объединенных в единое хранилище, что усложняло накопление и получение ценных для бизнеса аналитических выводов. Бизнес-пользователи нуждались в детальной аналитике и оперативном получении отчетности. Чтобы удовлетворить возникающие потребности бизнеса, было принято решение о создании единого хранилища данных (Data Lakehouse), в т. ч. использование Arenadata DB для запуска аналитической CRM. Это одновременно повышало стабильность получения данных, качество хранения и накопления, сокращало время получения их дата-аналитиками и бизнесом.

«Мы уже внедрили, настроили и заполнили бизнес-глоссарий, каталоги метрик и показателей. Сейчас все наши метрики ведутся в Arenadata Catalog. Благодаря внедрению продукта мы смогли спроектировать и построить иерархию связи, реализовали пирамиды метрик и обеспечили их визуализацию. Теперь мы видим все дашборды, их связи с данными, связываем data lineage с метриками в одном месте. Плюс смогли подключить BI-инструмент, и Arenadata Catalog еще выполняет роль централизованного каталога дашбордов. Команда „Национальной Лотереи“ использует ADC как полный единый источник знаний бизнеса о своих данных. Также его внедрение ускорило онбординг новых и повысило качество работы действующих сотрудников», — отметил Евгений Жилов, CDO компании «Национальная Лотерея».

Реализация проекта по строительству целевой архитектуры хранилища данных позволила команде «Национальной Лотереи» улучшить качество данных в компании и производительность хранилища. В его результате удалось:

сократить в 75 раз среднее время выполнения запроса;сократить количество ошибок при выполнении запросов в 7,5 раза;в 2 раза сократить количество ошибок по переполнению памяти;уменьшить время загрузки данных в 6 раз;настроить возможность получения обновления аналитической отчетности каждые 20 минут;сократить время расчета nRT-показателей в 15 раз.

Кроме того, производительность команды дата-аналитики за год выросла в 6 раз, а показатель Т2Data по отчетности сократился до 5–10 минут и дата-аналитики — до 1 дня в базовых сценариях.

Как отметил Евгений Жилов, благодаря переходу на новый Data Lakehouse и внедрению продуктов Arenadata «Национальной Лотереи» удалось полностью автоматизировали семь ключевых отчетов для компании, которые раньше готовились вручную, и теперь компания может развивать подходы Data Governance. Также она дополнительно нивелировала влияние ключевых рисков, включая риски систем алертинга и мониторинга. С хранилищем и бизнес-глоссарием работают ключевые команды компании, например бизнес-подразделение, финансы, стратеги, продукты. Важно, что дата-офис «Национальной Лотереи» состоит всего лишь из нескольких дата-инженеров, которые поддерживают обслуживание более 100 регулярных отчетов и дашбордов.

«Проект, реализованный „Национальной Лотереей“, наглядно демонстрирует набирающий актуальность тренд: прежде чем внедрять решения по работе с данными и строить крупные хранилища, необходимо обеспечить качество данных компании. Такой подход позволяет эффективно подойти к дальнейшей реализации задач по цифровизации», — считает Юлия Ильина, директор департамента по работе с финансовым сектором и международным бизнесом Arenadata.

Arenadata Catalog (ADС) — система управления корпоративными данными, которая помогает организациям внедрять процессы Data Governance. Система объединяет в едином интерфейсе каталог метаданных, бизнес-глоссарий, поиск, профилирование и проверку качества данных, платформу сотрудничества пользователей, автоматическое построение Data Lineage и другие функциональные возможности.

Arenadata DB (ADB) — аналитическая распределенная MPP-СУБД, построенная на базе проекта с открытым исходным кодом Greengage. Применяется в критически важных системах, работающих с большими объемами данных.

Arenadata DB предназначена для работы с большими аналитическими запросами и способна содержать в корпоративном хранилище десятки терабайт данных.