«Мы русские люди, которые сделали американский стартап»

Как ИИ-стартап Particle прогнозирует движение цен на сырьё по твитам и новостям


30 апреля 2019





В рубрике «Стартап дня» — компания Particle и её основательница Татьяна Любимова. Particle — российский ИИ-стартап, созданный для американского рынка, который с помощью технологий обработки естественного языка позволяет анализировать новости и твиты и на основе полученной информации предсказывать движение цен на сырье.

Татьяна рассказала Rusbase, почему команда решила переориентироваться с рекрутинга на сырьевые рынки, как цены на сырьё зависят от твитов и смайликов, почему даже российским игрокам в первую очередь важны новости на английском, в чём преимущества американского рынка, а также о планах на развитие, конкурентах, команде и сложностях.
Татьяна Любимова и Илья Никольский
— Я читала, что вы большую часть детства провели в Америке, но высшее получили уже в России. Как так вышло?
— В детстве я училась в московской школе, но при этом много времени проводила с семьей в Аризоне и Калифорнии. Московская школа позволяла иметь сравнительно свободный график посещения до средних классов и отпускала меня в США.

В детстве тебе кажется, что это катастрофа, потому что ты не находишься полноценно ни тут, ни там. А в реальности это даёт огромный опыт с точки зрения развития и понимания того, как мир устроен. Это очень много.

Старшую школу я заканчивала в Москве, и в Москве поступала в МГУ.
— Как родилась идея Particle? У вас ведь до этого был другой бизнес?
Нам очень хотелось сделать стартап в Кремниевой долине — мне кажется, каждому в 2015 году хотелось иметь такой проект.
— Мы с кофаундером Ильей Никольским почти сразу после окончания вуза открыли свою первую компанию в сфере рекрутинга, Fourmi Formidable. Мы продали её в конце прошлого года, решив сфокусироваться на Particle.

У Particle есть историческая привязка к предыдущему бизнесу. Поскольку у нас был рекрутинговый бизнес, мы поняли, что нужна технология, которая поможет автоматизировать труд рекрутера и будет автоматически подбирать кандидатов — когда одной кнопкой ты загружаешь описание вакансии и получаешь список подходящих сотрудников.

Это была первая идея, то, с чего начался Particle. В процессе стало понятно, что рекрутмент — это очень личный процесс, и люди пока не готовы полностью отдать его на откуп машине. Довольно много всего нужно систематизировать внутри текстов, не всегда у тебя есть полная информация, не всегда кандидаты хорошо пишут про себя в резюме, а работодатель — формулирует описание вакансии. Поэтому многие процессы в HR-технологиях уже автоматизированы, но составление шорт-листов до сих пор является чем-то закрытым, над чем люди бьются. И решить это в ближайшие годы, как мне кажется, будет технологически невозможно.

Тем не менее, это был стартовый толчок, чтобы создать Particle. Мы быстро поняли, что расти с той скоростью, с которой мы хотим, у нас не получается, поэтому сама лингвистическая база осталась, а продукт поменялся.
— Сколько вас было в команде на старте?
— Помимо нас с партнёром были дизайнер и кодер. На тот момент казалось, что это всё, что нужно для успеха.
— В 2016 году вы участвовали в конкурсе «Первая высота» от McKinsey и Winter Capital, об этом довольно много писали. Что дал вам этот конкурс?
Поговорить перед внешними экспертами и сформулировать свою идею и продукт — это очень полезно.
— Когда ты формулируешь все свои сумбурные идеи в некую презентацию, приводишь к виду, который должны понять другие люди, это всегда помогает. Помогает и сформулировать, чем ты занимаешься, и обозначить для себя тот этап, на котором ты находишься.

А что конкурс нам дал… Мне кажется, главное — уверенность. Самое важное чувство, с которым мы оттуда вышли. Это была планка, которой мы достигли. Понятно, что конкурс стартапов не гарантирует дальнейшую счастливую судьбу, но тем не менее.
Правильно я понимаю, что бизнес-модель вы поменяли довольно быстро, почти сразу после конкурса?
— В октябре 2016 года мы зарегистрировали компанию и выиграли конкурс, а в марте 2017 уже поменяли модель. То, что сейчас представляет из себя Particle, появилось как раз тогда.
Расскажите про сам продукт — что такое Particle?
То, что пишут в социальных сетях и новостных потоках, очень важно. Мы занимаемся анализом этих текстов, на их основе выявляем факторы, которые движут цены на сырьё, и помогаем движения этих цен прогнозировать.
— Продукт позволяет получить коллективное мнение о сырье и на его основе предугадать движение цены. В режиме реального времени мы понимаем, что люди думают про сырьё, основываясь на новостях и твитах, которые они пишут.

Мы занимаемся сентиментным анализом. В последние годы сентимент стал очень важен для сырьевых трейдеров и производителей. Если посмотреть на сырьевые рынки, можно увидеть, что финансовая надстройка над ними просто гигантская. Внезапно не фундаментальный анализ начал диктовать, куда пойдёт цена, а то, что люди об этом думают.
Смешной пример: мы делали анализ твиттера и смотрели на смайлики, которые ставят люди в Манхэттене. Нас интересовала только одна вещь — смайлик, и только одна точка — Манхэттен. Выяснилась забавная закономерность: независимо от того, ребёнок ставит смайлик или взрослый, продавщица в магазине или трейдер, он очень хорошо скоррелирован с движениями рынка.

Смайлики радостные — рынок идёт вверх. Смайлики грустные — рынок идёт вниз. Меня всегда спрашивают, являются ли смайлики реакцией на рынок или наоборот. На самом деле это взаимосвязанные процессы. Когда у нас много радостных смайликов, рынок движется вверх. Если случается какой-то обвал, у нас моментально идёт реакция — негативный сентимент, который какое-то время движет рынок дальше вниз. Постепенно люди начинают привыкать к ситуации, смайлики меняются на радостные, рынок отыгрывает.

При этом сырье — это необязательно нефть или драгоценные металлы. Это может быть зерно, еда и так далее. На втором месте по популярности торгов находится кофе. Свиная грудинка — тоже очень хорошо торгуемый сырьевой товар. В Индии безумно большой рынок специй, они у них торгуются на бирже.

Мы на данный момент работаем с нефтяными сентиментами и планируем выходить на рынок драгоценных металлов.
— Что представляет из себя ваш продукт с технологической точки зрения?
— С технологической точки зрения это AI. Я бы не углублялась в страшные слова и названия. Суть в том, что мы учим компьютер работать с текстом точно так же, как с ним работает человек. Это даёт нам потрясающий эффект, потому что мы способны повторить действия людей. Для этого использовались разные лингвистические технологии.

Наш сотрудник, который возглавляет блок лингвистики, — известный специалист со множеством публикаций на тему NLP. Поэтому мы действительно знаем про компьютерную лингвистику очень много и может практически всё.
Я также читала, что у вас очень быстрое решение, которое читает тексты в десятки раз быстрее человека. Это правда так?
— Да. Мы читаем новости в 100 раз быстрее, чем человек, и с тем же качеством. Это примерная оценка, на самом деле скорость уже сильно выше. Мы понимаем, где что в тексте находится и на что это влияет.

У нас очень мощные поисковые модули. Поиск по массиву, где хранится 600 млн новостей, занимает миллисекунды.
Сколько человек у вас в команде?
— 30 человек. Мне кажется очень важным, что у нас работает равное количество мальчиков и девочек. У нас много потрясающих девушек-программистов. Это абсолютно американская история про гендерное разнообразие, которая сложилась естественным образом. Девушки возглавляют лингвистику, проектный менеджмент, data science. Мы этим очень гордимся.

Если говорить о направлениях — у нас есть инфраструктура, data science, компьютерная лингвистика, аналитика, а также маркетинг и продажи.

Команда в основном российская, маркетинг и продажи находятся в Америке. Вообще мы российская компания и очень этим гордимся. При этом мы изначально работали только с американским рынком — то есть мы русские люди, которые сделали американский стартап.
— В какой момент вы открыли американский офис?
— Офис в Калифорнии у нас появился почти сразу — была возможность сделать саблиз по очень хорошей ставке. Но надо понимать, что офис в Калифорнии — это не совсем то, что обычно себе представляют. Здесь есть огромные здания и парки у компаний вроде LinkedIn, Slack или Netflix. У стартапов это скорее комнаты, сюда не приведёшь партнёра. На всё безумные цены, тебе невыгодно арендовать.

Но так как у нас нет разработки в Америке, это не проблема — здесь совсем небольшая sales-команда, один человек вообще работает удалённо.

Вот в Москве у нас настоящий офис в три этажа, в самом центре, на Тверской.
— А Илья работает из Москвы?
— Мы делим время в Америке и России. Сейчас он находится в Москве. Он отвечает за продуктовую часть, я больше за общение с клиентами. У нас очень гармоничное распределение обязанностей, наша совместная работа с ним позволяет достигать в десятки раз больших результатов, чем есть бы каждый из нас что-то делал сам.
— Как вы вышли на вашего первого клиента после того, как сделали новую версию продукта?
Я бы хотела сказать, что мы сделали продукт и вышли на клиента, но на самом деле всё было наоборот — мы вышли на клиента и уже под него сделали решение.
— У нас была очень интересная история выхода на заказчика. Мы хотели попасть в Y Combinator, и я попросила знакомого представить меня их партнёру. Она слушала меня примерно семь минут, сказала, что ей всё понятно, и сделала три интро с компаниями-выпускниками акселератора. Одна из этих компаний стала нашим клиентом.

Это был первый заказчик, который сказал, что наша технология может хорошо работать не для описания вакансий, а для других целей.
— Насколько я знаю, у вас сейчас 12 клиентов, и практически все — это институциональные финансовые компании в США. Расскажите, для каких целей они используют ваше решение?
— Понимание сентиментов даёт понимание краткосрочного движения цены. Клиентам это нужно для разных целей: в случае трейдеров — это принятие трейдинговых решений buy-sell, в случае сырьевых производителей — это планирование продаж.
— Какая у вас система монетизации?
— Годовые подписки. Самый маленький контракт — 200 тысяч долларов. Самый большой был примерно на 650 тысяч долларов.
— Какую выгоду ваше решение может приносить клиентам?
— Если компания хеджирует порядка 5% от общего объёма продаж, то при тех точностях, которые мы показываем, это приносит дополнительные 2-5 млн долларов в год. Подчёркиваю, это при том, что хеджируется не вся сумма, а только 5% от общей суммы. Не очень большие деньги, но ощутимые.
Particle в цифрах
12 клиентов
Большинство — американские финансовые компании
$500 тысяч
Выручка в 2017 году (по данным компании)
$200 тысяч
Минимальная стоимость контракта
$1,5 млн
Выручка в 2018 году (по данным компании). Прибыль Particle не раскрывает
$120 тысяч
Инвестиции в компанию (из них $45 тысяч — собственные средства основателей)
$3 млн
План по выручке на 2019 год
— Кто у вас занимается привлечением клиентов? Отдел продаж?
— Лично я. В этом году у нас впервые появится должность sales-директора, который будет строить pipeline продаж.

Мы понимаем, кто наш покупатель, и выстраиваем более-менее классическую воронку для его привлечения — узнаём про людей, выходим на них через LinkedIn или другие источники, договариваемся о встрече. На закрытие контракта уходит от 2 до 6 месяцев.
— У вас также есть один клиент в России. Расскажите, как вы на него вышли?
— Модель сейчас работает на нефти, следующая сырьевая категория, которую мы будем запускать — это драгоценные металлы. Мы нашли коллег и экспертов в этой индустрии и через них вышли на клиента.

Нам очень важно глубокое понимание того, какие факторы являются критичными для цены, за чем мы будем охотиться внутри твита или новости. В случае нефти это может быть ОПЕК или политические события, в случае драгоценных металлов это автомобили или производство в Китае и так далее.
— Есть ли у вас конкуренты на российском и других рынках?
Российский рынок
На российском рынке у нас нет конкурентов — никто не занимается анализом новостного потока для того, чтобы предсказывать движения цен.
— Единственный конкурент, которые делает лингвистику, это ABBYY Lingvo, но у них другая специализация.

Объясню на примере: есть низкоуровневые языки программирования, есть высокоуровневые. Есть C#, на нём можно написать вообще всё что угодно, а есть Python, которые намного проще, но тоже решает множество задач меньшим количеством кода.

Насколько я понимаю, продукты ABBYY очень фундаментальные, низкоуровневые, базовые. У них много возможностей, они, например, используются компаниями для систематизации, вычленения различных данных из любых типов документов (номера договоров, контекстные данные и так далее). У нас же решение более специализированное и высокоуровневое — мы занимается анализом новостных потоков и на основе их делаем выводы по тому, что будет происходить с сырьём.

Почему ещё у нас нет конкурентов на российском рынке: мы работаем с английскими текстами. С русскими тоже умеем, но наш продукт даже для российских компаний актуален на английском, так как на нём они читают сырьевые новости. Русскоязычной аналитики выходит очень мало. Новости на русском в течение 3 минут появляются на английском. Так как мы не занимаемся высокочастотной торговлей, для нас задержка в 3-10 минут не играет никакой роли.
Американский рынок
— На американском рынке у нас конкуренты есть. Довольно много компаний, которые делает сентиментные модели для акций. Это Apple, Snapchat, GE и другие — то есть S&P 500. На этом рынке работать просто, потому что хорошие события — это хорошо для акций, плохие — плохо.

Если произошёл взрыв на производстве Exxon Mobile, для акций компании это негативный сентимент — цена пойдёт вниз. При этом взрыв на каком-то производстве может быть очень позитивным событием для цены на нефть, то есть для сырья плохая новость может быть хорошим сентиментом. Умение различать, когда плохое — это хорошо, а когда плохо, — важный навык. В этом сложность сырьевых рынков.
— Какие у компании планы на развитие?
— Хочется быть самым главным инструментом в жизни любого сырьевого трейдера. Мы будем всё для этого делать.

Мы также будем доделывать всякие интересные решения, которые больше применимы к американскому рынку — это, например, связь твитов с американскими формами финансовой отчётности. Станет возможным связать новости про компанию с реальными финансовыми показателями.

Более общая цель — это экспансия в другие сырьевые группы и рост в количестве клиентов и физических юзеров. Понятно, что у каждого клиента в B2B есть пользователи нашего инструмента в виде трейдеров.
— Были ли у вас инвестиции? Планируете ли поднимать раунд?
— Сначала проект развивался на наши личные средства, потом мы получили 75 тысяч долларов на конкурсе в 2016 году.

У нас есть мысли о привлечении инвестиций, скорее всего, мы будем делать раунд, чтобы вырасти в продажах. Пока не можем раскрыть подробности.
— С какими сложностями вы столкнулись в процессе развития проекта?
Был, например, пожар в офисе. И то это не трудность. Всё, что можно измерить деньгами, это не сложности, а затраты.
— На самом деле не было особых сложностей. Я бы с радостью рассказала какую-то драматичную историю, но её нет.

Всегда, когда нам сложно, появляется какой-то магический человек, который помогает решить наши проблемы. Так что если ты движешься и работаешь, всё как-то решается.

Сложно было сформулировать, что мы в конце концов делаем. У нас был лингвистический движок, который был способен на множество разных вещей. Определиться, какую ценность мы приносим рынку, было не так легко.
— У вас интересный опыт ведения бизнеса и в России, и в США. Расскажите, в чём, на ваш взгляд, разница подходов к ведению бизнеса на этих двух рынках?
— Мы смотрим на себя скорее как на глобальную компанию. Просто в Америке сейчас очень перспективный рынок. Кремниевая долина является столицей IT-компаний, и для нас кажется правильным быть в том месте, где рождаются технологичные проекты.
1
Бюрократия
Из очевидных вещей — в Америке чуть меньше бюрократии, нет необходимости ставить печати. Я подписываю документы за секунду из любого места, у меня есть авторизованная подпись в Adobe. Аналогично — у Ильи. Это очень здорово.
2
Скорость принятия решений
Второе отличие — в России ты можешь долго встречаться с разными компаниями, тебе будут говорить, что твоё решение выглядит очень интересно и можно сделать демо. Полгода ты можешь жить в состоянии B2B-продажи, когда тебе кажется, что у клиента есть потребность, потому что тебя периодически о чём-то просят. Ты можешь думать, что всё хорошо, когда реально всё плохо.

В Америке тебе быстрее, честнее и чётче дадут понять, что то, что ты делаешь, никому не нужно. Зато скажут, «если бы ты делал вот это, я бы купил». Или наоборот — тебе сразу предложат пилот. Американский рынок отличает высокая скорость принятия решения и умение говорить «нет».
Мнения экспертов
Принцип «Выигрывает первый, а остальные — собирают остатки» действует везде. Желание предсказать будущее на фондовом рынке всегда было и будет. Это базовая потребность. Её всегда пытались удовлетворить, раньше инсайдеры, теперь новые технологии, например, на базе ИИ. Ключевой момент — это доступ к информации, чтобы на доли секунды обойти конкурентов и вовремя отреагировать на рыночный тренд.

Если в режиме пары кликов можно получить максимально точный прогноз по рынку, эта технология однозначно будет востребована. Но нельзя забывать, что динамика стоимости акций заметно отличается от ситуации на товарном рынке: цены падают и растут мгновенно, а затем затем медленно выравнивается до среднерыночного уровня спроса/предложения. Поэтому интересно, как Partiсle будет отслеживать долгосрочные тренды с помощью предиктивной аналитики и анализа информационного поля.
Александр Поцелуев, сооснователь инвестиционного фонда Russian Friends Capital
Михаил Аленушкин
Генеральный директор ИК CRESCO Finance
В приводимом компанией примере аналитики текста понятна только фиксация самого факта движения цены после определенной новости, но не прогноз его скорости и длины вектора. Чтобы глубоко оценить влияние подобного информационного сообщения на рынок и использовать его в торговле, необходимо проанализировать целый ряд факторов: глубина падения, уменьшение производства при взрыве, на сколько сократится при этом предложение нефти, так как взрыв на производстве может остановить прием сырья для переработки и так далее.

Если же такого анализа не будет, а будет только оценка первичного сентимента, то направленная торговля на новости может быть похожа на гадание по кофейной гуще. Авторы стартапа дают информацию о критериях и реперных точках (словах), которые они анализируют внутри новости. Но для торговли на данном рынке важна не только сортировка новостного потока по важности события и его воздействию на сырье.

Важно, есть ли у алгоритма так называемая «искусственная память», которая помогает трейдеру понять, заложена ли новость в уже существующей цене на сырье, либо она является первичным драйвером.
Вадим Кравчук
Аналитик инвестиционно-финансовой компании «Солид»
Если подобное инновационное решение на самом деле помогает определять дальнейшую динамику цен на сырьевые товары, то, безусловно, оно является крайне полезным как для участников рынка, так и для производителей. Более того, найдется несколько десятков инвестиционных компаний, которые захотят купить алгоритм, причем вопрос цены будет второстепенным.

Однако мы скептически оцениваем попытки прогнозирования динамики цен на сырье с помощью мониторинга публичных новостей и постов в социальных сетях. Как минимум, требуется тестирование на исторических данных и в условиях реального рынка. Без ознакомления с подробностями подобных тестов сложно делать вывод. А учитывая, что рынок постоянно меняется, и они могут оказаться не настолько полезными.

По этой технологии возникает ряд вопросов и возможных ограничений. Прежде всего нужно понимать, что на цены активов влияют преимущественно фундаментальные факторы, такие как баланс спроса и предложения, например. То есть имеет место некоторая ассиметрия информации. Допустим, менеджмент или руководство страны уже знает о планах по сокращению добычи, также эта информация известна инсайдерам, которые начинают закладывать ее в цены, но общественность узнает об этом только после официального сообщения, когда принимать решение о покупке или продаже актива довольно поздно.

По сути, данный алгоритм скорее всего показывает некоторые настроения на рынке, то есть кого больше — продавцов или покупателей, но эта информация известна из биржевых отчетов. Однако мы видим перспективы у алгоритма, например, для определения «перегретого» рынка — он может позволять заранее выявлять так называемые «пузыри» по аналогии с IT-компаниями во время кризиса «доткомов» или ситуации с криптовалютами в 2017.
©Rusbase, 2019
Автор: Татьяна Петрущенкова
Фото: Particle



Татьяна Петрущенкова
Как Particle прогнозирует движение цен на сырьё по твитам и новостям