YOUNG

«Мама говорила, что меня не возьмут на работу в 17 лет». История начинающего дата-сайентиста

YOUNG
Анна Меликян
Анна Меликян

Редактор Young

Мария Передок

19-летний Михаил Павлухин — дата-сайентист. Свой первый проект — систему распознавания лиц — он создал в 16 лет. Последние два года Миша работает в компании Angel Relations Group, успевает придумывать собственные проекты, курирует школьные команды и занимается самообразованием. 

Миша рассказал Rusbase, как увлекся анализом данных, почему решился на академический отпуск и как люди реагируют на его возраст.

«Мама говорила, что меня не возьмут на работу в 17 лет». История начинающего дата-сайентиста

Первый проект

В школьные годы я участвовал в разных научных школах, в частности в «Лифте в будущее» от фонда «Система». Над первым коммерческим проектом я начал работать в 15 лет: тогда мы делали систему для коммуникации школьников, разрабатывающих проекты, и экспертов. Система работала на нескольких школах «Лифта в будущее» и паре проектных конкурсов.

После этого получил предложение от АСИ разработать для них систему распознавания лиц для пропуска в их «Точки кипения». Задача была такой: определить, что за человек проходит на мероприятие. Я занимался бэкэнд-разработкой, мой напарник — фронтэндом.

В системе использовалась нейронная сеть, которая извлекала из фотографии лица признаки в виде набора чисел, а затем искала по базе признаков лиц посетителей совпадение. Система не просто распознавала лица, а служила инструментом охранников для пропуска людей в «Точку кипения». 

Разработка использовалась в течение пары месяцев в нескольких «Точках кипения», принесла хорошие результаты как в скорости, так и в точности распознавания, но потом из-за организационных моментов была, к сожалению, заморожена. Кстати, сама разработка еще жива и может быть использована на рынке. 

Почему я ушел в академический отпуск

В 16 лет я поступил в ВШЭ на программную инженерию, но потом перевёлся в том же вузе на прикладную математику. Мне интересна математика, но на том направлении для меня было слишком много теории, поэтому сейчас я в академическом отпуске: хочу немного переосмыслить своё направление в учёбе и то, чем я хочу заниматься в дальнейшем. 

Дело в том, что когда я поступал, мне хотелось писать код и я думал, что буду заниматься этим всегда. Со временем я заметил, что мне интересно не только решать «прогерские» задачи, но и взаимодействовать с командами, клиентами, пытаться понять их проблемы и придумывать для них решение. Я это понял, когда поучаствовал в хакатонах. 

Сейчас я развиваюсь больше как тимлид, изучаю дизайн-мышление и customer development, а дата-сайенс и программирование для меня уже не единственная цель, а скорее инструменты для достижения целей в других областях.

Сейчас я думаю, что пошёл бы на бизнес-информатику, потому что мне интересны бизнес-процессы, экономическая часть, и мне нужно побыть в этой среде.

Я считаю важным получать дополнительное образование, так что периодически беру себе курсы на Coursera. Чтобы улучшить знания, также проходил очный курс по Data Science от NewProLab. Еще много читаю, мне нравится покупать бумажные учебники: они гораздо приятнее электронных. 

В Data Science люди приходят как с техническим образованием, так и без него: знаю нескольких гуманитариев, которые с нуля обучались сами. Так что мне сложно судить, насколько высшее образование необходимо. Мне кажется, все зависит от целей. Если ты хочешь заниматься наукой, исследованиями, то надо идти в вуз: там ты получишь хорошую математическую базу и понимание того, как все работает. При этом если у тебя много времени и ты упорный, то можно все эти выучить самостоятельно, просто это чуть более долгий процесс.

Как получить работу в 17 лет

Сейчас я занимаюсь анализом данных: дата-инжинирингом, созданием моделей, сбором и обработкой информации. Мы разработали систему мониторинга для брендов в сфере недвижимости.

Одна из функций программы — исследование эмоций клиентов, их комментариев, которые мы потом используем для автоматизации оценки. Компании с помощью этой информации узнают, насколько клиенты довольны их продуктами. 

В этом проекте нельзя взять типичный дата-сет для распознавания эмоций по тексту: в сфере недвижимости есть специфические термины, и в обычной речи они могут оцениваться по-другому.Так что изначально мы вручную размечали данные по комментариям, чтобы потом обучить модель, которая делает это самостоятельно. Это позволит людям, работающим над мониторингом, обрабатывать больше отзывов клиентов, не пропускать какие-то вещи из-за человеческого фактора, а также оценить эмоциональный фон в интернете по отношению к какому-то бренду.

Как научиться управлять командой

В IT-направлении ARG есть не только внутренние разработки и решения клиентских задач, но и блок по запуску своих стартапов, куда я привлекаю внешних сотрудников к работе. Поэтому сейчас расту и в управлении: на мне подбор специалистов/команд и курирование их работы.

Один из самых важных скиллов, который нужно развивать — коммуникация. В работе с командой кто-то может находиться в другом часовом поясе, что-то может произойти дома. Без правильно построенных коммуникаций все может пойти не так. 

В работе мы используем Basecamp, но даже с его лозунгом «Работа может подождать» от сотрудников требуется дисциплина в выставлении задач и соблюдении сроков, а также готовность тимлида закрыть какой-то вопрос самостоятельно.

Клонирование речи — и другие проекты

В свободное от работы время я занимаюсь собственными проектами. В вузе, когда я занимался курсовой работой, я выбрал тему «клонирования речи». Идея появилась, потому что я хотел смотреть фильмы на русском, но с голосами оригинальных актеров. 

Сейчас проекты типа «Алисы» или Google-ассистента берут много примеров речи одного человека и на этом обучают сеть. Я работаю над тем, чтобы сети было достаточно 10-15 секунд разговора одного человека, чтобы воспроизводить его речь.

На эту тему есть много исследований, но пока хорошего качества никто не добился. Для меня это эксперимент, но надеюсь, он будет успешным. Релиз планирую в конце весны. 

Еще я работаю над методами оптимизации нейронных сетей. Это больше исследовательская штука, чем прикладная.

Кроме этого я курирую команду в школе IT-решений компании КРОК, где школьники создают проекты в сфере IT. 

Каково работать дата-сайентистом в 19 лет

Сомнения по поводу того, стоит ли начинать работать в 17 лет, были у моей семьи: мама говорила, что меня никто не возьмет на работу, пока я не закончу вуз. На работе же это никого не смущает. Сначала люди, конечно, удивляются, что я столько умею в 19 лет, но это лишь первая реакция — потом уже никто не обращает внимания. 

С прикладными задачами обычно все решается достаточно быстро, так как с этим я сталкиваюсь каждый день. Правда, я чувствую, что математическая база у меня не такая крепкая, но я обычно все изучаю сам: прохожу курсы, читаю статьи, даже оплачиваю подписку на Medium.

У меня свободный график, но он построен исключительно от задач. Первый год я еще совмещал работу с учебой. Бывает сложно совмещать все проекты, но я стараюсь выписывать свои задачи и распределять их по важности: что я делаю в первую очередь, что во вторую и сколько мне на все это понадобится времени. Сроки по задачам часто не совпадают с реальностью, но для меня это возможность для саморазвития. 

Фото на обложке: архив героя материала

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 Стартап, собственный бизнес и консалтинг: как я успел поработать в 5 компаниях до окончания вуза
  2. 2 «Я набрал долгов у друзей, родственников и дураков». Как студент запустил онлайн-курсы для будущих экономистов
  3. 3 «У нас нет возможности облажаться»: Как в 21 год запустить систему беспилотных грузовиков и выйти на европейский рынок

Актуальные материалы —
в Telegram-канале @Rusbase