Что из себя представляет его работа и что должен знать хороший дата-сайентист, чтобы получать от 100 тыс. рублей в месяц, рассказывает основательница международной школы анализа данных и разработки Mathshub, преподаватель AI-программ Айра Монгуш.
Содержание:
- Дата-сайентист: что это за профессия
- Чем отличается дата-сайентист от других ИТ-специальностей
- Где работают дата-сайентисты
- Плюсы и минусы профессии
- Необходимые навыки дата-сайентиста, где на него учиться
- Где найти работу и заказчиков
Дата-сайентист: что это за профессия
Дата-сайентист (Data Scientist) создает модели и алгоритмы извлечения информации из баз данных, чтобы позже их проанализировать и полученный отчет использовать для решения задач бизнеса. Ведь для бизнеса ценны не столько сами таблички с данными, сколько их готовая интерпретация: какие есть повторяющиеся места в поведении пользователей приложения или, наоборот, аномалии.
На основе этого анализа дата-сайентист строит прогнозы и определяет тенденции, например, в поведении пользователей, чтобы позже этой информацией могли пользоваться разработчики и маркетологи для улучшения ленты рекомендаций при выборе товара в интернет-магазине. Чем обширнее база, тем больше сложностей в очистке и обработке информации.
Чем отличается дата-сайентист от других ИТ-специальностей
Дата-сайентисту наобходимо разбираться в трех сферах:
- разработке,
- математике и статистике,
- бизнес-процессах.
Только так он сможет работать одновременно с техкомандой продукта и с теми, кто занимается продвижением и продажами.
Иногда дата-сайентиста путают с дата-аналитиком, поскольку оба специалиста работают с уже готовыми базами и занимаются их анализом. Однако дата-сайентист стоит на ступень выше именно потому, что предлагает собственные модели извлечения данных с учетом знаний о продукте и его стоимости.
В этом ему помогают знания о том, как устроено машинное и глубокое обучение (Machine Learning, Deep Learning). Аналитик же работает по готовым моделям, но у него есть шанс вырасти в дата-сайентиста.
Где работают дата-сайентисты
Компетенции дата-сайентиста нужны в любой сфере, собирающей большое количество баз данных.
- В финтехе дата-сайентисты работают с отчетами, транзакциями, кредитными оценками, чтобы предлагать инвестиционные стратегии, прогнозировать рынок и оценивать риски.
- В доказательной медицине анализ генетических данных, клинических исследований и медицинских записей используют для определения эффективности лекарств или методов лечения.
- В логистике обрабатываются данные о транспортных потоках для оптимизации маршрутов и расписаний, а также улучшения безопасности на дорогах.
Медиа и реклама, образование, eCommerce, тяжелое машиностроение — перечисление можно продолжать долго.
Читать по теме: Как проходит рабочий день инженера данных в крупной технологической компании
Плюсы и минусы профессии
Сегодня специализация в технологиях, основанных на работе ИИ, имеет ряд преимуществ:
- Высокий спрос на рынке труда, поскольку цифровизация предприятий и бизнеса вышла из модного тренда и становится уже must-have для производств.
- Высокая зарплата. Зарплата в РФ может значительно варьироваться в зависимости от опыта и уровня квалификации, а также от компании и региона.
Например, на момент написания статьи на сайте hh.ru размещено 219 вакансий Data Scientist с указанным размером дохода, из них 159 (72,6%) — с зарплатой от 100 тыс. рублей. Это выше средней во многих регионах.
- Интеллектуальный вызов. Работа дата-сайентиста — это всегда интересные и сложные задачи, ведь глобальная цель его профессии в том, чтобы сделать жизнь клиентов проще и удобнее, а бизнес — прибыльнее. А это подразумевает баланс между желанием прогресса и техноэтикой, чтобы не переходить черту, за которой будут в опасности персональные данные людей, денежные средства и т. д.
- Широкие возможности карьерного роста. У дата-сайентистов есть разделение на джуниор-, мидл- и сеньор-уровни. Кроме того, у них есть большие перспективы стать продакт-менеджерами, поскольку их стык знаний и накопленный опыт в перспективе поможет управлять развитием продукта или услуги в целом. Еще один вариант развития карьеры — переход в ML-инженера, чтобы проектировать и оптимизировать уже не просто модели извлечения информации из базы данных, но и сами базы.
Однако эта профессия имеет и существенные недостатки:
- Необходимость постоянного обучения. Инструменты ИИ постоянно обновляются, и чтобы оставаться востребованными, придется постоянно обновлять собственную экспертизу и следить за тем, что делают конкуренты. Появление и массовое распространение ChatGPT — образец того, как одна компания заставила напрячься всех техногигантов, включая «Большую четверку».
- Неопределенность в работе. У дата-сайентистов могут быть очень разнообразные задачи, в которых не всегда очевидно как решение, так и результат. Это может повлиять на повышение уровня фонового стресса, ведущего, в свою очередь, к профессиональному выгоранию и общему ухудшению здоровья.
- Высокий риск ошибок. При обработке и анализе большого объема данных риск допустить ошибку с серьезными последствиями выше. В работе дата-сайентистов ошибки могут быть к тому же сопряжены с прямыми финансовыми потерями бизнеса.
Читать по теме: Специалист по данным: как эта профессия изменилась за 10 лет
Необходимые навыки дата-сайентиста, где на него учиться
У каждого вида дата-сайентистов есть свой специфический набор навыков и инструментов, но в самом общем виде каждому из типов пригодятся:
- Математическое мышление и знание математики в целом;
- Статистический анализ — без него никуда при программировании и пользовании Python и языка запросов SQL;
- Умение обращаться с базами данных, знать основные инструменты обработки больших данных вроде Hadoop Mapreduce и Apache Spark;
- Понимание, как визуально представлять полученные данные, строить модели;
- Знания английского языка для изучения технической литературы;
- Усидчивость. Работа дата-сайентиста — это многочасовое времяпрепровождение наедине с монитором или двумя.
- Знание специфики компании и ее отрасли — строить одни и те же модели для металлургического завода и приложения с рецептами будет практически невозможно.
Из «мягких» навыков помогут умение работать в команде и презентации результатов работы.
Конечно, проще всего стать дата-сайентистами тем, кто уже имеет опыт в программировании или хотя бы математический бэкграунд из вуза. Если такого нет и хочется понять, ваше ли это направление, лучше всего взять бесплатные курсы по программированию.
Среди англоязычных — гарвардский курс по основам программирования CS50, на русском языке есть «Поколение Python» на Stepik, введению в Machine Learning mlcourse.ai. Начать стоит именно с технической части, поскольку она будет составлять большую часть работы.
На одних только компетенциях в организации бизнес-процессов продержаться нереально. Но если вы изучите технические инструменты, опыт в бизнесе будет козырем при трудоустройстве.
Если вы поняли, что Data Science — это ваше, берите полноценные курсы по выбранной специализации в ИИ на обучающих платформах. Время обучения с нуля и до мидл-уровня варьируется от 9 до 24 месяцев.
При выборе обращайте внимание на то, чтобы в программе были все три компонента, необходимые для дата-сайентиста: Python и SQL, математика и статистический анализ, разбор бизнес-процессов.
Где найти работу и заказчиков
Для поиска работы можно использовать следующие источники:
- Cайты вроде LinkedIn, Indeed, Glassdoor, если вне РФ; HeadHunter, SuperJob, Geekjob, Careerspace и другие внутри РФ.
- Порталы, специализирующиеся на предоставлении проектов фрилансерам. За пределами России работают Upwork, Freelancer, Fiverr. В России работают fl.ru, Kwork, Freelance.ru, Avito, Profi.ru и т. д.
- Сайты компаний, которые работают в сфере аналитики данных, машинного обучения, искусственного интеллекта и других связанных с этим областях. Те же «Яндекс», VK, «Сбер», «Тинькофф» регулярно обновляют на своих порталах список вакансий.
- Конференции, семинары и вебинары, где можно встретить работодателей и потенциальных заказчиков.
Конечно же, без опыта найти работу будет сложно, но это не значит, что вам нечего показать потенциальному работодателю. Оформите свои соцсети под поиск работы, создайте портфолио из, к примеру, выполненных тестовых заданий или учебных заданий с курса по Data Science. Удача улыбается тому, кто действует.
Читать по теме: С какими IT-профессиями легче всего переехать в другую страну: список
Фото на обложке: Unsplash
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
- Пройти курс «Как построить личный бренд»
- 1 Анализ клиентов и построение риск-моделей в банкинге
- 2 Названы IT-профессии, на которые в России активно ищут новичков
- 3 Фокус на компанию. 6 советов дата-аналитику для работы с бизнесом
- 4 3 задачи по ML, чтобы подготовиться к собеседованию на Junior Data Scientist
ВОЗМОЖНОСТИ
28 января 2025
03 февраля 2025
28 февраля 2025