Войти в почту

Нужен ли подход Data-Driven внутри организации?

В первую очередь data-driven – это про смену парадигмы принятия решений с «я художник, я так вижу» на взвешенные решения по результатам анализа цифр, графиков, таблиц и того, что за ними лежит.

Нужен ли подход Data-Driven внутри организации?
© It-world

В этой статье руководитель группы данных и машинного обучения ICL Services Сергей Щербаков попробует проанализировать гипотезу, что подход, управляемый данными, не всегда продуктивен, если речь идет о корпоративной среде, и как быть, чтобы продуктивность все же появилась.

Основные требования подхода

Если быть более конкретными, то data-driven подход требует, как минимум, трех вещей:

Данные – это необходимая основа; Инструментарий для их анализа, так как бизнесу не стоит нырять в сырые данные (прим. автора: т. н. raw data) во всем их многообразии и неоднозначности; Культура принятия решений.

Это однозначный и минимальный набор того, что надо внедрить, чтобы считать себя «data-driven организацией». И если кто-то считает, что разобраться с данными – это самая сложная часть, то он глубоко ошибается. Сложнее всего, конечно же, работа с людьми. Но давайте обо всем по порядку.

Повторюсь, данные - это основа. Во всем их многообразии, изменчивости, неоднозначности, а иногда и проблематичности. Однако с ними разобраться можно и нужно, тем более, можно начинать постепенно – определить сферу первоочередных интересов и наладить сбор данных в этой части. Но надо понимать, что под «наладить сбор» подразумевается не просто сбор данных, но и накапливание истории, очистка данных, контроль их качества, объединение данных из нескольких источников вместе. Плюс немаловажный аспект – это описание данных. Ведь если данные есть, но никто не знает, что кроется под названием «customField_100500», то какая тогда от них польза? И только когда у вас есть данные, которым можно верить, тогда можно поставить «галочку»: основа готова.

Как бизнес работает изнутри

Но будем реалистами – бизнес не полезет в базу данных, не будет разбираться в схемах, таблицах, справочниках, фактах, джойнах и так далее. Разумеется, есть исключения, которые отлично могут закопаться в данные вплоть до источника, разбираются и вникают в детали.

Но, во-первых, можно задать вопрос – а точно ли это эффективная трата времени лица, принимающего решение? А, во-вторых, особенно на начальном этапе, если ЛПР вынужден разбираться в данных самостоятельно, высока вероятность, что он махнет рукой, скажет «да гори оно все огнем, что еще за таблички» и сделать по-своему, по старинке – из серии «наши деды так делали и нам велели».

Данным нужна понятность

Для того, чтобы бизнес мог делать выводы и принимать решения на данных быстро и эффективно, они должны быть собраны в понятный вид – графики, диаграммы, сводные таблицы, где будет только та информация, которая действительно нужна, а не все многообразие цифр, которые генерирует конкретная компания. Для этого и нужен инструмент, причем не так важно какой – BI для красоты, Excel для универсальности, машинное обучение или Искусственный Интеллект для больших данных или другие. Главное, чтобы соблюдались три пункта:

во-первых, чтобы инструмент был; во-вторых, чтобы были люди, которые умеют им профессионально пользоваться для разработки чего-то нового (к примеру, отчетов, графиков или прогнозов); в-третьих, чтобы бизнес умел с ним работать на пользовательском уровне.

И дальше начинается самое сложное – привить людям культуру опираться на данные при принятии решений. И здесь есть два пути:

1. Пойти сверху-вниз, когда руководство насаждает такую культуру, постоянно спрашивая подтверждение планов, проектов, решений на имеющихся данных и графиках.

2. Пойти снизу-вверх, когда есть инициативные подчиненные, которые сами всегда подтверждают свои выкладки графиками и таблицами, приучая таким образом и руководство, и коллег к правильным подходам.

Дашборды – не панацея

К сожалению, нередка ситуация, когда менеджмент привык жить по старинке и работать на ощущениях, да и подчиненным удобно опираться только на свой опыт и делать по «накатанной. Данных может быть сколько угодно, они могут быть высококачественными, разложенными по информативным графикам, но все это будет лежать в дашбордах, в них будут смотреть ИТ/Дата/BI- (нужное подчеркнуть) специалисты – и радоваться.

Но будем реалистами – если нет задачи от руководства, то чаще всего не будет «красивых дашбордов», все встанет еще на этапе работы с данными. Ведь попытка вычистить «авгиевы конюшни» данных, т.е. сопоставить показатели из разных систем, да так, чтобы они были похожи на те ощущения, к которым все привыкли, с наибольшей вероятностью провалится с треском.

Прививать культуру постепенно

Как по мне, это и есть самое сложное в процессе становления data-driven – выработать не просто привычку, а именно культуру использовать данные при принятии любого решения, отслеживать происходящее не по ощущениям, а исходя их объективной реальности, данной нам в таблицах, цифрах и графиках.

Не могу не заметить, что на самом деле есть еще один, немаловажный аспект работы с данными – нужна культура постоянных экспериментов и тестирований новых гипотез. Иначе компания рискует замкнуться «в пузыре» известных фактов и уйти в застой, просто потому что новых фактов нет, а взяться им неоткуда.

Кто-то может сказать, что здесь есть противоречие и тестирование гипотез – это опять же про художников и их видение. На самом деле, это действительно так – выдвигать и тестировать гипотезы должны истинные художники и виртуозы своего дела. Но никакого противоречия тут нет, так как это должны быть продуманные и контролируемые эксперименты.

Они должны подчиняться нескольким критериям:

вопросы и гипотезы сформулированы однозначно, аудитория подобрана правильным образом, тесты выбраны так, чтобы однозначно отвечать на поставленные вопросы, заранее определены те данные и метрики, которые будут собираться в процессе эксперимента для однозначного ответа на вопрос, подтверждается или опровергается гипотеза.

Сложнее всего – начать, а аппетит придет во время еды

И именно этот процесс постоянного тестирования гипотез (на данных, конечно же) позволит избежать застоя и быть уверенными, что нет упущенных возможностей и развитие идет в правильном направлении.

Главное здесь – не бояться опровергнутых гипотез. Гипотеза, которая не подтвердилась – это не провал, ведь эксперимент считается успешным, если получен любой однозначный ответ, даже если он отрицательный. Ведь это позволило с помощью небольшого теста понять, куда идти не надо. Так что провал эксперимента – только если мы не можем однозначно ответить на поставленные вопросы. В этом случае мы потратили деньги зря и не достигли поставленной цели.

Таким образом, data-driven – это нечто более сложное, чем просто данные, которые собраны в отчет, пылящийся на столе у руководителя. Но с другой стороны, уровни зрелости по работе с данными никто не отменял. Можно начать с бумажных отчетов на начальном уровне, потом перейти к онлайн дашбордам и ИИ, а дальше уже дойти и до постоянного улучшения и регулярных проверок гипотез. Самое сложное – начать, а дальше аппетит придет во время еды.