Top.Mail.Ru
Колонки

Как выстроить Data Science отдел в корпорации

Колонки
Павел Доронин
Павел Доронин

CEO AI Today, Founder AI Community

Ольга Лисина

AI Community в рамках проекта AI Heroes регулярно проводит вебинары с ведущими экспертами в области Data Science. 

4 февраля прошел вебинар с Павлом Мягких — Head of Data Science в Tele2. Также Павел — Director of Data Science в Commercial Lab и организатор Data Fest в ODS.ai. На его счету работа с проектами MediaMarkt, Adidas, Reebok, Concept Club, Acoola, Tupperware, University of Liverpool.

Павел рассказал о нюансах создания успешного проекта: какие люди должны быть в составе команды и как следует выстроить архитектуру отделов.

Смотреть все материалы серии

Как выстроить Data Science отдел в корпорации

Почему состав команды так важен?

Предприниматели хотят создавать качественные продукты, приносящие прибыль. Для этого нужна сбалансированная команда с четким распределением обязанностей, которая создаст систему и комплексные решения.

Идеальная схема выглядит так: мы создаем один автоматизированный продукт. По завершении мы над ним не работаем, а он приносит деньги. Переходим к созданию второго продукта и так далее. 

В случае несбалансированной командной работы, мы создаем ad-hoc’и, которые трудно масштабировать. Ценность нашего бизнеса либо не растет, либо растет линейно — хотим больше зарабатывать, больше работаем, нанимаем больше людей, люди дорогие. В итоге дело закончится провалом. 

Чтобы избежать провала, читайте о грамотном распределении ролей в команде.


Роли data-boys и data-girls

Data Analyst


Начнем с дата-аналитиков — эти люди находятся на передовой обработки данных. 

Аналитики данных знают вашу базу данных лучше других специалистов, знают, где и какие данные взять, быстро их находят, сводят и считают. Четко отвечают на поставленные вопросы и правильно их задают.

Любопытный дата-аналитик самостоятельно работает с данными и понимает, в чем их польза для бизнеса. 


Требования:

Hard skills:

  • SQL
  • Немного Python
  • Визуализация данных
  • Понимание структур данных

Soft skills:

  • Коммуникация результатов
  • Умение разбираться в бизнес-задаче


Data Scientist


Дата-сайентисты — математики. 

Главная цель их работы — сделать точно. 

Перед ними стоят два типа задач:

  1. Построение любых математических моделей
  2. Декомпозиция бизнес-задач на эту математическую модель

Требования:

Hard skills:

  • Python/R
  • SQL
  • Алгоритмы машинного обучения
  • Теория вероятности
  • Мат. статистика

Soft skills:

  • Коммуникация с заказчиком
  • Умение превратить бизнес-задачу в математическую постановку

Data Engineer


Дата-инженеры — люди с системным складом ума. 

Они создают пайплайн данных — данные от вашего кассового аппарата через длинную цепочку систем складываются в data lake. Также дата-инженеры работают с моделями, которые разработали дата-сайентисты. Они обвязывают модели текстами, структурами, мониторингом и доводят до готового продукта.


Требования:

Hard skills:

  • SQL
  • Hadoop
  • Spark
  • Python
  • Kubernetes 
  • Docker

Soft skills:

  • Умение работать в команде

Product Owner


Продакт-оунер — мини-CEO продукта. 

Он общается с командой и ставит задачи, знает потребности заказчика, обладает полной картиной развития продукта. На его плечах ответственность за итоговый продукт и его масштабирование.


Требования:

  • Внешние и внутренние коммуникации
  • Владение PnL продукта
  • Разработка стратегии продукта
  • Умение организовывать процесс разработки и добывать ресурсы

Business Analyst


Бизнес-аналитики требуются не во всех проектах. 

К их помощи прибегают, когда продукт сложный и комплексный. А также если внедрение продукта требует изменения бизнес-процессов. 

Бизнес аналитик знает, как сейчас работает бизнес и как он будет работать после внедрения продукта. Благодаря этим людям вы можете быть уверены, что работа принесет результат.

Пример работы без бизнес-аналитика

В компании разработали модель, которая прогнозирует реакции людей на маркетинговые акции на неделю вперед. В конце работы показали модель маркетологам. Оказалось, что маркетологи работают двухнедельными циклами. Контент-план расписан на две недели вперед. 

Итог: модель работает, но не применима. Команда работала 2–3 месяца впустую.


Требования:

Hard skills:

  • Методология описания бизнес-процессов 
  • SQL
  • Опыт оптимизации бизнес-процессов

Soft skills:

  • Коммуникации с внешними и внутренними коллегами

Проекты Data Science состоят из разных компонентов и для них подходят разные люди. Чтобы создавать качественный продукт, очевидно, нужна продуктовая команда. Если не делать этого, то ваш Data Science станет фабрикой ad-hoc’ов
Павел Мягких

Архитектура data science-отделов

Люди думают, что большинство компаний выстроено таким образом: в разных отделах есть инициативы по Data Science.


На самом деле все гораздо хуже. 

Между S&OP (планирование продаж и операций) и Back-office (торговая система компании) — соревнование в духе корпоративных игр. S&OP хотят, чтобы все обязанности от Back-office перешли к ним. 

Между Marketing и другими отделами — китайская стена. Эта система ненадежна, работа не структурирована. Люди дублируют процессы, базы данных и делают двойную работу. 


Работающая система выстроена следующим образом

В компании создан единый центр Data Science, в котором собираются все компетенции по DS. Они аккумулируются, дата-сайентисты разрабатывают модели. Связующий элемент — product owner’ы. Их задача — соединять бизнес с центром компетенций. Они передают информацию, инициативы, проекты.


Существует устойчивое убеждение, что 2020–2021 гг. — период трансформации функции анализа данных в крупных компаниях. Как будет построена работа?

Центр компетенций — место концентрации наибольшего количества знаний и навыков. Оттуда информация передается в отделы, к которым она относится. Задача — передавать наилучшие технологии и опыт в функции в структурированном формате.


Все это нужно, чтобы создать business partnership — среду делового партнерства — без конкурентной гонки.


Выводы

Перед предпринимателями стоят следующие цели:

  • Создать новый продукт
  • Сделать улучшенную версию существующих аналогов
  • Масштабировать бизнес
  • Создать сплоченную команду, вдохновленную одной идеей
  • Увеличение прибыли

Все это возможно в среде делового партнерства, где люди понимают ценности компании, понимают свои задачи и стараются ради общего дела.


Как получить максимум

Ответьте для себя на следующие вопросы:

  • Чего вы хотите достичь?
  • Каков ваш идеальный состав команды?
  • Достаточно ли у вас сейчас сотрудников?
  • Правильное ли у вас распределение обязанностей?
  • Разделяет ли ваш коллектив ценности компании?

Подумайте о трансформации архитектуры ваших отделов и создании сбалансированной команды. 

В результате прибыль вашего бизнеса вырастет.


Фото на обложке: Shutterstock / foxaon1987

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 Как развитие технологии Big Data меняет состав IT-команды
  2. 2 Data Science: как растет сфера и какие профессии выбирать
  3. 3 В России катастрофически не хватает инженеров данных – кому и зачем они нужны
FutureFood
Кто производит «альтернативную» еду
Карта