«Мы не делаем "Большого Брата"».
Основатель VisionLabs о развитии компании,
конкуренции и технологии распознавания лиц


27 апреля 2020





В 2012 году инженер-робототехник Александр Ханин вместе с тремя партнёрами основал компанию VisionLabs, которая специализировалась на компьютерном зрении. Сегодня VisionLabs предлагает бизнесу в России и за рубежом комплексные решения в области распознавания лиц и объектов. Среди клиентов — банки, ритейлеры, транспортные компании, всего около сотни крупных заказчиков. Выручка ООО «ВижнЛабс», по данным «Контур.Фокус» на конец 2018 года, составила 540,5 млн рублей (в 2017 году — 127 млн рублей). В 2016 году в компанию вложился венчурный фонд Sistema VC, который купил 25% VisionLabs при оценке в 1,4 млрд рублей. В конце 2017 года инвестором также стала дочка Сбербанка «Цифровые активы», получившая 25,07% акций.

В январе этого года Ханин оставил пост генерального директора VisionLabs, однако сохранил долю в компании и пост председателя совета директоров. Александр продолжит управлять всей группой и сосредоточится на построении команды, продуктовой стратегии, международной экспансии, работе с инвесторами и крупнейшими клиентами.
Мы поговорили с Александром Ханиным об устройстве компании VisionLabs, работе на зарубежных рынках и конкуренции, стратегии и продуктовом предложении, мошенничестве и киберзащите, а также о том, реально ли обмануть систему распознавания лиц, насколько этично использовать такую технологию и кому она особенно нужна в период пандемии.
Фото: Антон Львов для Rusbase
— Расскажите, как построены бизнес-процессы VisionLabs? Сколько человек работает в компании, кто за что отвечает?
— В российском и зарубежных офисах работает больше 100 человек. Наш основной продукт и драйвер — это платформа компьютерного зрения и видеоаналитики, а также умные устройства. Однако к ней добавляется и другая аналитика — распознавание поведения, пола, возраста, эмоций, а также объектов (например, марок и номеров автомобилей). Недавно у нас появилась линейка из четырёх девайсов в дополнение к платформе. Пока они продаются за рубежом, в будущем мы привезём их в Россию.

Мы продаём софт корпоративного уровня для решения бизнесовых задач, обычно — крупным заказчикам. Мы делаем не «Большого брата», а автоматизацию и прозрачные бизнес-процессы, которые облегчают людям жизнь. Идея в том, что разработчики, исследователи и другие сотрудники компании должны любить ту технологию и тот продукт, который они создают. Если ты понимаешь, зачем делаешь что-то для себя, с большой вероятностью это будут ценить и другие люди. Сейчас так и происходит.

У нас есть зарубежные офисы, например, в Амстердаме, Сингапуре, Дубае. Планируем открыть ещё несколько офисов в других странах. За границей у нас больше активностей, но с точки зрения выручки Россия и СНГ пока занимает примерно половину, так как это исторически домашний рынок.
— Когда вы вышли за рубеж?
— Контракты вне России у нас были ещё в 2014 году, но это не считается выходом за рубеж. Скорее, взяли и продали, вопреки всему. Полноценно мы вышли на мировой рынок в 2018 году, когда у нас появился офис и команда в Амстердаме. До этого были только попытки, поездки на конференции, небольшие заказы.
— Сколько человек в российской команде? Какие у вас есть направления работы?
— В российском офисе работает больше 80 человек. Важное отличие VisionLabs от большинства компаний в том, что команда, отвечающая за продукт, разделена на три части:
Research Scientists
Их сфера ответственности — это технология. Они создают алгоритмы, научно-стратегический потенциал.
Developers
Их задача — упаковать все фантазии учёных во что-то материальное, что можно представить в виде продукта.
Продуктовая команда
Они выступают медиатором между исследователями, разработчиками и бизнесом, и отслеживают, чтобы компания выпускала то, что нужно рынку. Потому что иногда исследователи хотят сделать прорыв и получить Нобелевскую премию, но для клиента это сейчас не актуально.
Кроме того, для каждого макрорегиона есть коммерческая команда.
— Сколько у вас заказчиков?
— Серьёзных платящих заказчиков — около сотни. В 2020 году планируем получать большую часть выручки из-за рубежа.
— Сколько вы заработали в 2019 году?
— Результаты за 2019 год пока не озвучиваем. Будет чуть лучше, чем планировали. Но мы всегда недовольны выручкой и относимся к себе самокритично. Мы считаем, что должны расти в разы каждый месяц. Нам нравится геометрический рост. Думаем, что это реалистичный сценарий.
— Какие регионы за рубежом для вас ключевые?
— Юго-Восточная Азия, Ближний Восток, США. Отдельно выделяем Японию.
— Насколько я знаю, в Азии есть довольно крупные и сильные игроки в сфере распознавания лиц. С кем вы там конкурируете?
— Если посмотреть международную статистику, тесты и количество внедрений, самые опытные игроки — это NEC в Японии и IDEMIA во Франции (ранее Morpho S.A.S.) Не могу сказать, что по технологии они превосходят нас, но у них обширный опыт и много заказчиков. Это наши основные конкуренты.

Китайцы очень сильны технологически, но они плохо продаются за рубежом. Так было ещё до санкций, когда 28 китайских компаний, в том числе наши конкуренты, попали в чёрный список США. Мы часто сталкиваемся с китайцами в Сингапуре и Японии, у них также были офисы на Ближнем Востоке.

Самые известные компании в Китае: YiTu Technology, SenseTime, иногда встречается Face++. Всё это громкие имена. SenseTime известен тем, что это самый дорогой стартап в AI. Их оценка — порядка 7,5 млрд долларов.
— За счёт чего вы с ними конкурируете? Точность распознавания?
Размер базы
На небольших базах никто не почувствует разницы между точностью алгоритмов. Например, на базе в сто человек качество распознавания практически любого решения будет достойным. Но в «умных» городах, в банках, на фабриках людей намного больше, и важным становится количество ложных срабатываний. Если их много, система сама себя компрометирует.
Потребляемые ресурсы
Мы сталкивались с китайскими компаниями, которые требуют примерно в 80 раз больше ресурсов, чем мы. Были ситуации, когда китайцы проигрывали нам в тендере и предлагали заказчикам своё решение бесплатно. Но затраты на поддержку их продукта после установки сильно превышали стоимость оборудования и лицензии VisionLabs.

Заказчику неважно, решаются его задачи с помощью распознавания лиц или других «неземных» технологий. Зато имеет значение параметр total cost of ownership (TCO), то есть стоимость владения системой. Самая идиотская идея, которая может быть — демпинговать и рушить рынок ценами. Клиент смотрит на стоимость владения в целом, и если он заплатит рубль на входе, а потом каждый год будет инвестировать огромные деньги, он не выберет такое решение.

По TCO мы значительно опережаем конкурентов, это видно в том числе по тесту NIST, который является неким ориентиром для большинства крупных заказчиков, особенно американских и азиатских.
Соответствие законодательству
Мы видим массу компаний, которые фокусируются на безопасности и не заморачиваются по поводу соблюдения законов. В Европе так работать — безумие, потому что ответственность очень серьёзная. Наверное, это не так важно, если продавать продукт спецслужбам, но для коммерческого сегмента это критично. Если вдруг окажется, что софт нарушает закон о персональных данных, компании придётся платить штрафы до десятков миллионов евро из-за GDPR. Поэтому мы очень много инвестируем в то, чтобы всё было законно.
— Почему вы фокусируетесь именно на коммерческом сегменте? Он более доходный, чем государственный?
Мы не просто учёные, которые приходят с сумасшедшими взглядами и словами: «Вот наша нейронная сеть». Очень часто на встречах мы ни разу не произносим эту фразу.
— Не могу сказать, что он более доходный — скорее, более рыночный. Банки — это организации с очень строгой финансовой дисциплиной. Говоря по-простому, они умеют вынуть душу за каждый рубль. Поэтому там покупают только те решения, которые действительно приносят пользу в виде заработанных или сэкономленных денег, а не те, что будут просто висеть и радовать владельца. Наше преимущество в том, что мы говорим на языке бизнеса.

Что ещё отличает нас от других игроков на рынке — мы часто говорим «нет». К предпринимателям иногда приходят заказчики, которые просят их, условно, предсказать судьбу. Стартапы соглашаются сделать это за N тысяч рублей. Мы же можем сказать, что это «цыганский R&D», которым мы не занимаемся. И потом, со временем, после того как клиенты поработают с аферистами, они обращаются к нам. Мы не совершаем чудо, а делаем так, чтобы результат соответствовал ожиданиям.
— Расскажите о наиболее распространённых сценариях применения ваших продуктов заказчиками.
— Ключевой сектор для нас — финансовый. Ещё есть ритейл, транспортные компании, «умные» города. Большой и универсальный сегмент — контроль доступа.
Антифрод
В банковской сфере всё довольно просто. Например, мы давно решили задачу минимизации кредитных рисков. Этот кейс называется антифродом. Во многих странах (и Россия здесь не лидер) люди мошенничают с поддельными документами, незаконно получают кредиты, а потом просто выкидывают фальшивые паспорта и справки. И так — бесконечно, пока их не поймают. Чтобы этого избежать, на национальном масштабе мы сделали возможным межбанковский обмен фотографиями и внедрили распознавание лиц.
Дистанционное обслуживание (Digital ID)
Это особенно актуально для больших стран вроде России и стран из нескольких островов. Банк не может открыть представительство на каждом острове или в каждом городе, людям приходится ездить в районные центры, на материк. Зато у каждого человека есть лицо, паспорт, мобильный телефон и интернет. Этого достаточно, чтобы пройти дистанционную идентификацию, открыть счёт в банке и получать кредиты, скидки, баллы и так далее. Решение актуально не только для банков, но и для страховых. Организациям это даёт повышение продаж и доступность оказываемых услуг при серьезном сокращении капитальных затрат.

Ещё это намного надёжнее, чем проверка паспортов вручную. Во время наших тестов в некоторых странах люди менялись паспортами и говорили сотруднику банка: «Я просто не выспался, на самом деле на фото я». В большинстве случаев оператор верит. Это кажется смешным, но когда думаешь, что кто-то может прийти и забрать твой депозит, сказав, что не выспался… В России паспорт выдаётся в 20 и в 45 лет, за это время человек сильно меняется. Оператор может этого не понять, а технология ошибается в десятки миллионов раз реже. Это её преимущество.

Так что с одной стороны — огромные объёмы оказанных услуг, с другой — надёжность, с третьей — более низкие затраты.
— Какие ещё есть кейсы применения технологии? Например, читала, в августе прошлого года VisionLabs стала партнером «Яндекс.Такси» для запуска мониторинга усталости водителей.
Мы работаем с рядом автопроизводителей и компаний, которые делают мониторинг для коммерческого транспорта. Например, наши алгоритмы позволяют определить положение головы, состояние глаз, направление взгляда и другие важные параметры лица.
Автопроизводители
Ряд автопроизводителей использует нашу технологию для повышения безопасности, чтобы можно было перехватить управление, когда водитель отвлекается. Другой кейс — это Face ID, который позволяет машине вспоминать настройки под каждого водителя. Это особенно актуально для постоянных пользователей каршерингов и car rentals. Водитель тратит первые десять минут на подгонку кресел и зеркал под себя. Если внедрить бортовую камеру с распознаванием лиц, автомобиль настроит себя сам.
Ритейл
В ритейле есть ряд кейсов, связанных с анализом посетителей. У нас был клиент — розничная сеть в Японии, которой нужно было использовать технологию, чтобы оптимизировать ассортимент каждого магазина под ожидания аудитории. Представьте, что точки продаж есть и в спальных районах, и рядом с университетом, и около бизнес-центров. Везде разные посетители со своими потребностями. Распознавание лиц помогает понять, кто приходит в магазин и что ему нужно.

Ещё распознавание лиц стирает границу между программой лояльности и обычной оплатой. Например, ряд ритейлеров сейчас внедряет оплату «лицом». Часто, если у вас есть карта лояльности, сначала с вас списывают всю сумму при покупке, а потом возвращают объём скидки. При оплате лицом средства снимаются с учётом скидок и бонусов, что очень удобно. Мы внедряем такое решение в нескольких азиатских странах. Думаю, что это большой тренд 2020-2021 годы.
Фото: Антон Львов для Rusbase
— Различается ли спрос на ваши решения в разных странах? Есть ли какие-то географические особенности?
— Так как мы работаем в основном на коммерческом рынке, всё более-менее похоже: если продукт приносит пользу и собственник бизнеса видит, что на нём можно сэкономить или заработать, надо просто не косячить — и тогда решение купят.

Менталитет, в целом, разный. В ряде стран невозможно продавать, если там нет офиса. Люди воспринимают его как гарант стабильности — они знают, куда можно прийти пообщаться.

Нам нравится познавать новые страны. Но мы открываем офисы только в тех регионах, где уже есть продажи.
— Расскажите подробнее про ваше продуктовое предложение. Вы сказали, что ваш основной продукт — платформа, плюс есть линейка девайсов.
— Ядро — это платформа LUNA. У нас есть ряд партнёров, которые берут ядро и на его базе делают свой вертикальный продукт. При этом платформа сама по себе является самодостаточным решением, которое быстро внедряется в банковской сфере, безопасных городах и у ритейлеров. Просто меняются вводные, типы уведомлений, иногда — языки.

У нас также есть вертикальные решения, которые относятся к умным городам. Например, платформа управления видео и видеоаналитики — софт, к которому можно подключить и распознавание лиц, и задачи по видеонаблюдению. Есть Face ID для автомобилей и анализа состояния водителя; решение по промышленной безопасности для отслеживания техники безопасности на производстве.

Девайсы — это уникальное предложение, потому что мы сами умеем разрабатывать и алгоритмы, и железо. Плюс все это защищаем с точки зрения кибербезопасности. Поскольку всё создано в рамках одной компании, аппаратная часть и программы идеально подобраны.
Мы предпринимали много попыток работать на чужих устройствах, но в этом случае не могли всё контролировать. А когда ты полностью контролируешь процесс, можешь выступать перед заказчиком ответственным лицом. Это ценится. Мы часто видим, как наши коллеги по рынку обвиняют в плохих результатах камеры. Нам не хочется быть в таком положении.
— Получается, вы работаете и через партнёров, и напрямую?
— Основной приоритет — продажи через партнёров. Просто есть ряд компаний, с которыми мы исторически работаем напрямую.

Ещё, когда мы открываем кардинально новое направление, важно слышать мнение пользователя. Многие стартапы сначала тратят полгода-год на создание продукта, а потом уже приходят к заказчику. В результате оказывается, что клиенту нужно только 10% от сделанного, и можно было прийти через 3 месяца. Чтобы не совершать таких ошибок, мы создаём продукты при непосредственном участии будущих потребителей.
— В анонсе LUNA СКУД в июне 2019 года вы говорили о том, что создание девайсов на базе алгоритмов VisionLabs — это реализация стратегии компании по переходу в сегмент поставщиков решений. Что это за стратегия?
Большинство алоритмов в сфере распознавания лиц легко обмануть: достаточно распечатать фотографию, и камера не поймёт, что это не реальный человек.
— В начале развития компании мы были некой лабораторией, которая работала в сфере компьютерного зрения и оказывала консалтинговые услуги. У нас были разовые проекты и не было продукта. В конце 2014 года у VisionLabs появилась SDK — маленькая библиотека, которая умела находить лица в кадре и сравнивать их. В период с 2014 по 2015 год мы разрабатывали платформу, которую уже использовали и партнёры, и конечные заказчики. Мы внедрили наше решение в разных сферах, увидели специфику и теперь понимаем, что в следующий банк можно принести не просто платформу, а целый комплект услуг со всеми необходимыми обвязками, то есть и продукт, и professional services. Это и является нашей стратегией.

В рамках её реализации мы выпустили собственные девайсы. Они нужны только в ряде специфических сфер, например, где есть контроль доступа или оплата лицом и очень важно обеспечить защиту от взлома. Наша сильная сторона в том, что мы очень много работали над киберзащитой и защитой от фейков.
— Читала в ваших интервью, что VisionLabs в целом делает большой упор на киберзащиту.
— Без этого в современном мире никак. Представьте, что крупная компания внедрила на тысячу проходных такие девайсы, а потом их взломали, и никто не может попасть на работу. Это скандал. Аналоги нашего решения от большинства конкурентов можно взломать за три минуты, и это огромные репутационные риски и операционные убытки. Мы понимаем эту боль бизнеса, поэтому делаем упор на безопасность и надежность.
— Как вы обеспечиваете кибербезопасность ваших решений?
— Мы работаем с партнёрами и не пытаемся изобрести велосипед. Для девайсов мы привлекли партнёров, которые на киберзащите «собаку съели».

Ещё у нас есть служба поддержки, которая работает 24/7. И мы собрали огромный опыт эксплуатации систем на больших объёмах. Банки хороши тем, что у них миллионы камер и десятки миллионов клиентов, которые тестируют технологию на широком круге операций и жалуются, если что-то не так.
— Где хранятся данные клиента? К чему вы как поставщик технологии распознавания лиц имеете доступ?
Мы избавлены от любых скандалов и рисков, связанных с данными сотрудников и клиентов.
— Мы передаём систему на сторону заказчика, где она работает в защищённом контуре. Для большинства корпораций это единственный выход. SME могут работать в облаке, но основной поток заказов — от крупного бизнеса. Кроме того, клиенты чаще выбирают on-premise в связи с особенностями законодательства.

Огромный риск для компании, которая внедряет непонятную систему распознавания лиц или документов, — это отягощение информационной системы, то есть необходимость в дополнительной криптозащите после внедрения. У нас есть заключение аудита, подтверждающее, что наше решение 100% работает с зашифрованными и обезличенными данными в соответствии с российским и международным законодательством. Мы даём все необходимые инструменты сотрудникам на стороне клиента, чтобы те могли загрузить данные, обезличить их и пользоваться системой.
— Вы говорите, что на рынке много мошенников. Почему?
Очевидно, что войти на рынок распознавания лиц очень легко. Вы можете скачать стандартные open-source-фреймворки, которые будут вполне достойными. Года три-четыре назад мы даже мечтать не могли о таком качестве в свободном доступе.
Поэтому многие берут скачанные адаптированные модели и делают продукт. Наверное, этого достаточно для ряда задач. Но между такой поделкой и промышленным решением уровня «mission critical» и «business critical» — огромная пропасть.

Но в целом хорошо, что есть много компаний, которые поддерживают интерес рынка к теме и разогревают его.
— В одном из интервью вы говорили о том, что российский рынок очень маленький. С чем это связано, если игроков становится всё больше?
Думаю, это может быть связано со слабой инфраструктурой и осторожностью заказчиков. Например, в Китае камер наблюдения на два порядка больше, чем в России.
— Если посмотреть отчёты вроде MarketsandMarkets, можно увидеть, что большую часть составляет оборудование для биометрии, меньшую — софт. Российский рынок софта — это порядка 100 млн долларов за 2018 год (мировой рынок — 4-6 млрд долларов). При этом CAGR менее 10%.

В России много компаний, которые делают качественное распознавание лиц, но объем рынка небольшой. Мы планируем раскачать его за счёт вертикальных решений и удерживать на нём серьёзную долю.
— А какие у вас планы на развитие с точки зрения продукта? Вы упоминали разные виды аналитики помимо распознавания лиц в начале разговора.
— Если раньше мы занимались face centric аналитикой, сейчас фокусируемся в целом на human centric, то есть анализируем всё, что связано с человеком и его жизнедеятельностью — лицо, поведение, внешность, манеру ходьбы и так далее.
— В 2018 году в вас проинвестировал Сбербанк. Вы изначально нацеливались на инвестиции от крупного банка?
— Когда мы обсуждаем инвестиции, всегда думаем о том, чтобы это были не просто финансовые инструменты, но и прежде всего партнёрские отношения. Мы считаем, что и Sistema VC, и Сбербанк — это smart money. Их основная ценность не в деньгах, а в экспертизе и колоссальном масштабе.

Сбербанк — хороший партнёр, потому что у них серьёзная экспертиза в искусственном интеллекте, кибербезопасности, построении платформ и user-friendly-продуктов. Мы многому учимся. Ну и в целом экосистема Сбербанка включает много разных компаний, с которыми мы дружим. Это и розничная коммерция, и облака, и аппаратная часть.
— Ищите ли вы сейчас инвестиции?
— У нас нет сильной потребности в деньгах, но мы рассматриваем разные предложения, всегда к ним открыты, общаемся с рядом международных инвесторов.
Фото: Антон Львов для Rusbase
— Как влияет коронавирус на ваш бизнес? Что вы делаете, чтобы справиться с кризисом?
Те компании, что внедрили продукты с распознаванием лиц в свой бизнес, будут иметь явное конкурентное преимущество и после эпидемии.
— Команда полностью адаптировалась к работе из дома и продолжает работать в штатном режиме. Наши продукты по распознаванию лиц сейчас крайне необходимы в борьбе с вирусом. Особенно востребован продукт по дистанционной идентификации. Сейчас мы реализуем большие проекты в ряде регионов России, на Ближнем Востоке, в Юго-Восточной Азии и США. Также многие компании из сферы ритейла стали активнее внедрять бесконтактную оплату на базе распознавания лиц, чтобы уменьшить внешние контакты покупателей. Сейчас по всем СМИ регулярно говорят о личной гигиене, и для клиентов это будет определяющим аргументом при выборе магазина, банка и так далее.
— Пара вопросов про саму технологию. Есть ли действенные способы обмануть технологию распознавания лиц?
Если ты делаешь яд, должен знать противоядие — и наоборот. Поэтому мы подходим к вопросу очень скрупулезно.
— Мы знаем несколько десятков способов сделать это за минуту. Мы в этом плане параноики, и, прежде чем выпускать решение на рынок, пытаемся сами его беспощадно ломать.

Технологией, которая умеет распознавать лица, занимается всего несколько человек. Гораздо больший штат людей делает из этого продукт, и в их ответственность входит в том числе надёжность. Если решение обеспечивает первое место по качеству распознавания в мире, это повод гордиться, но не повод давать ему зелёный свет. Если оно сломается у заказчика, грош ему цена.

Мы привлекаем большое количество тестеров, которые ломают продукт и позволяют его развивать. Например, в 2018 году мы проводили конференцию «Machines Can See» и в рамках саммита устроили большой публичный конкурс «Adversarial Attacks on Black Box Face Recognition». Он полностью имитировал работу мошенников, которые пытаются взломать технологию, не зная, как именно она работает. Люди даже получали за это призы.
Плохая новость — в том, что нашу технологию сломали, хорошая — что с теми, кто это сделал, мы сотрудничаем до сих пор. В ряде процессов мы довели стоимость взлома до такой степени, что это просто становится невыгодно. Вряд ли кто-то будет тратить 200 тысяч для того, чтобы получить доступ
к бесплатному проезду на метро.

— Многих людей сегодня волнует вопрос этичности распознавания лиц. Какая у вас позиция по этому вопросу?
— Этичность распознавания — это важный вопрос. Я не зря говорил, что мы тратим много ресурсов на соблюдение законности распознавания. Законы в этой области, в том числе в России, очень суровые. Соответственно, если ты их соблюдаешь — всё нормально.

Большую часть пользователей всё устраивает. Мы проводим опросы, которые это подтверждают. Представьте, что вы запустили на банковскую сеть плохой продукт. Конечно же, его попросят отключить. Но к нам за столько лет не поступило ни одной жалобы на эту тему.
~
©Rusbase, 2020
Автор: Татьяна Петрущенкова
Фото на обложке: Антон Львов для Rusbase



Татьяна Петрущенкова