Top.Mail.Ru
Колонки

Как построить бизнес «на данных»: обратите внимание на парсинг

Колонки
Кирилл Кузнецов
Кирилл Кузнецов

Основатель «Усиленных Инвестиций»

Ангелина Касмынина

Кирилл Кузнецов — основатель «Усиленных Инвестиций» (более 3,5 млрд руб. активов под управлением — по данным компании), инвестор, предприниматель, ранее вице-президент Группы «Спутник» — рассуждает о бизнесе «на данных» и разбирает одно из простых направлений для запуска — модель парсинга.

Как построить бизнес «на данных»: обратите внимание на парсинг

В этой статье я расскажу, как с российскими корнями строить капитализируемый tech-бизнес, а также рассмотрю вариант парсинга — с одной стороны, дающий технологическое преимущество, а с другой — не слишком сложный в плане инфраструктуры и необходимых инвестиций. Другими словами, обсудим бизнес, построенный вокруг сбора и обработки данных. 

Опыт «Усиленных Инвестиций» лег в основу этой статьи: внутри компании за последние 4 года нам удалось создать уникальную платформу, которая собирает данные более 4000 публичных компаний и обеспечивает автоматизированный инвестиционный анализ.

Помимо моего личного опыта с инвестиционно-аналитическим бизнесом на базе данных, я включил примеры успешных бизнесов, построенных моими друзьями и знакомыми — для более расширенной иллюстрации. 


По теме: «Только 3% данных правильно собираются и хранятся»: вот как работать с ними лучше


 

Аспекты классного бизнеса: технологичность, быстрый рост, международность

Представим, что наша задача — это построить крупный капитализируемый бизнес. Один из самых успешных early stage инвесторов в мире — Y Combinator (инвестировали на ранних стадиях в Stripe, Airbnb и кучу других успешных единорогов) дает много информации о том, как это сделать.

Примерно то же самое пишет фаундер LinkedIn Рид Хоффман в книге Blitzscaling: The Lightning-Fast Path to Building Massively Valuable Companies и Питер Тиль в книге Zero to One. Рассмотрим конкретнее.

Чуть ли не самые главные штуки, которые должны быть в бизнесе — это технологичность и быстрый рост. 

  • Технологичность: практически единственная возможность получить в настоящее время устойчивое конкурентное преимущество. 
  • Быстрый рост: так как и мы, и венчурные фонды нацелены на то, чтобы быстро приумножить свой капитал (фонды ожидают получить возврат инвестиций более 30-50x за 3-5x лет на выстреливших проектах, поэтому ждут от успешных стартапов рост 20-30% месяц к месяцу). 

Почему бизнес в идеале должен быть международным, думаю, особо объяснять не стоит. На российском рынке сейчас ограничены возможности выхода из бизнеса. И раньше было только три покупателя — Сбер, «Мейл» и «Яндекс», а сейчас и они никого особо не покупают. 

Строить международный бизнес удобно на сборе и последующей обработке/перепродаже данных, поскольку для сбора данных вам не обязательно присутствовать в другой стране как физически, так и юридически (в отличие от, например, фудтех-компаний). Вы можете делать это практически из любого региона.

 

Парсинг: простой способ построить технологичный и международный бизнес

Тем, кто впервые сталкивается с этим термином, поясню: парсинг — это автоматический сбор данных с других сайтов. На самом деле один из относительно несложных видов построения бизнеса — как раз через такой сбор. 

Много крупных бизнесов построено вокруг парсинга: это агрегаторы авиабилетов, новостей, банковских и страховых, брокерских, букмекерских, риэлторских и прочих услуг. Часто такое предприятие работает следующим образом: 

  • Вы пишете робота, который «ходит» по другим сайтам и собирает информацию, а затем складывает ее в базу данных; 
  • Далее идет обработка данных: например, рейтингование товаров по привлекательности для клиентов;
  • Клиенты начинают посещать сайт, потому что хотят узнать, где лучше купить тот или иной товар;
  • После того как сайт начал привлекать клиентов, вы можете продавать лиды поставщикам товаров и услуг и зарабатывать на этом.

В этом типе бизнеса удобно и то, что для запуска продукта вам ничего не надо. Сбор данных, их рейтингование и обработку написать не так сложно, договариваться на стартовом этапе тоже ни с кем ни о чем не нужно.


По теме: Новостные агрегаторы: какими они бывают и для чего нужны



А законен ли парсинг вообще? (спойлер: скорее да, чем нет!)

Понятно, что многие компании не хотят, чтобы вы собирали информацию с их сайтов. Например, в кейсе LinkedIn против HIQ пришли к тому, что парсинг вполне законен. Аналогичным образом в России робот Вера выиграл суд против компании HeadHunter и продолжил парсить данные о кандидатах с сайта.

При этом мы часто сталкиваемся с тем, что сайты стремятся защитить свои данные от роботов. Здесь встает вопрос, кто кого победит — иногда приходится использовать прокси-сервисы с динамической сменой IP, парсинг при помощи selenium (когда компьютер, по сути, просто повторяет действия человека) и другие уловки.

 

На базе парсинга можно строить разные бизнесы

Может показаться, что все основные ниши таких бизнесов уже заняты, но это не так. Прямо сейчас я вижу, как друзья и знакомые запускают новые довольно успешные бизнесы, основанные на этом подходе.


По теме: Как генеративный ИИ использует наши данные


 

Пример 1: Новый растущий географический рынок + AI обертка

Realiste — движок, собирающий данные по предложениям на рынке недвижимости и подключающий AI-анализ для определения наиболее перспективных. Активно вырос при экспансии на рынок Дубая. 

Клиентам коллеги продают решение как искусственный интеллект для анализа ситуации на рынке недвижимости Дубая и других стран и поиска лучших сделок, а также для мониторинга своего портфеля недвижимости. По сути же они зарабатывают на продаже лидов. Та же модель: агрегация, обработка и визуализация данных, но примененная на модном рынке недвижимости Дубая.

 

Пример 2: Оптимизация маршрутов в новом бизнесе (крипта) 

VIA Protocol — коллеги написали тулл, выкачивающий из блокчейна информацию о мостах и стоимости конвертации одних валют и коинов в другие, и на базе этого построили прибыльный и быстрорастущий бизнес. 

 

Пример 3: ИИ-решение для принятия торговых и инвестиционных решений

Мы в своем стартапе Enhanced Investments строим как раз такой бизнес — парсим множество финансовых данных по торгуемым на фондовом рынке компаниям, а также более 100 различных ресурсов, которые влияют на экономику компаний.

Модели предсказывают с учетом сдвига в ценах на продукцию, сырье и валюты (какие будут лучше отчитываться), и с учетом этого прогнозирует их будущие доходы.

Изначально мы собирали данные руками и вели все модели оценки компаний в Excel-табличках, но перенос данных на сервера и автоматизация сбора и обработки позволили быстрее и лучше находить инвестиционные идеи, что существенно ускорило рост активов под управлением.

Есть огромное множество перспективных направлений для сбора, обработки и продажи данных, и вышеперечисленные примеры — лишь часть. Среди многообещающих течений также можно выделить анализ спутниковых данных (пример: OneSoil, стартап с белорусскими корнями), сбор данных для инвестиций и многое другое.

Резюмирую, что поможет достичь максимума при построении бизнеса «на данных»:

  • Соблюдение трех главных принципов: технологичность, быстрый рост и международность.
  • Парсинг: создание робота, обработка собранных им данных, использование данных для целей бизнеса.

Как видно из короткого списка, этот способ создания бизнеса крайне прост своей структурой.

Основываясь на моем опыте разработки уникальной платформы и многих других успешных примерах, можно утверждать, что современная конкурентная среда требует высокой степени инновационности и адаптивности, и подобный вид запуска бизнеса можно по праву считать потенциальной основой для успешного предприятия.

RB.RU рекомендует лучших поставщиков цифровых решений для вашего бизнеса — по ссылке

 

Фото на обложке: Shutterstock/TippaPatt

Подписывайтесь на наш Telegram-канал, чтобы быть в курсе последних новостей и событий!

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 «Осторожно, данные»: как безопасно взаимодействовать с LLM
  2. 2 Как нейросеть распознаёт страницы паспорта и находит подделки
  3. 3 Эволюция ML-сервисов в микрофинансовых организациях и советы по внедрению
  4. 4 Цифровые двойники: как работают, зачем нужны и как смоделировать своего
  5. 5 С какими сложностями может столкнуться компания при внесении данных в IT-системы и как упростить этот процесс
FutureFood
Кто производит «альтернативную» еду
Карта