Никита Стаценко

«У малого бизнеса есть шанс выстрелить в области компьютерного зрения»

В Университете Иннополис завершилась VIII Летняя Школа высокопроизводительных вычислений в области компьютерного зрения. Приглашённые лекторы рассказали, чем оно отличается от зрения человека и как эти технологии изменят нашу жизнь.


Около 90% информации об окружающем мире мы воспринимаем с помощью глаз. Компьютерное зрение — такой же источник видимой информации и метрических данных о трехмерном мире. Простейший пример компьютерного зрения — определение лица и улыбки в цифровых фотоаппаратах.

В этом году VIII Летняя школа высокопроизводительных вычислений посвящена теме компьютерного зрения. В качестве экспертов организаторы школы пригласили сотрудников компании Singularis Lab — одной из немногих российских компаний, которые занимаются разработками в области компьютерного зрения. В этой компании создали библиотеку для разработки приложений и программ, связанных с обработкой цифровых изображений. От спикеров школы мы узнали о специфике и перспективах компьютерного зрения.

Компьютерное зрение похоже на зрение ребенка

Программист Singularis Lab Алексей Алексеев говорит, что компьютеры могут молниеносно производить сложные вычисления и анализировать большой объем данных, полученных из окружающего мира. Но чтобы машине до конца понять, что она видит перед собой, ей необходима помощь человека. Например, автопилот должен получить установку, что столб нужно обогнуть, а двигаться можно только по дороге, но никак не по тротуару.

Подобно зрению человека, методы компьютерного зрения адаптируются к окружающему миру, учатся выделять значимые признаки объектов (цвет, форму, текстуру, контекст), разделять объекты на классы (сначала — найти лицо, потом — различить эмоции, определить пол и возраст; сначала — найти собаку, а потом — различить десятки и сотни пород собак).

Изображение, обработанное нейросетями Google. Источник

В то же время задачи и методы компьютерного зрения во многом отличаются от зрения человека. Например, для компьютерного зрения характерно извлечение точных, измеримых данных (например, размеров, координат или количества объектов). А еще много классических методов, применяемых в компьютерном зрении, не имеют прямой аналогии с биологическими методами зрения, в частности, такие методы, как преобразование Фурье, преобразование Хафа, контурный анализ. Эти методы предполагают, что искомые признаки объекта выделяются специалистом и закладываются в систему заранее.

Если вы посмотрите на картинку выше, то сможете назвать все объекты на ней, не задумываясь. У компьютера всё иначе: он не видит точный набор объектов, а воспринимает картинку как массу абстрактных пикселей, из которых нужно извлечь нужную информацию.

Компьютерное зрение призвано научить машину ориентироваться в пространстве и правильно реагировать на ситуации, свидетелем которых она становится. «То есть компьютерное зрение добавляет “железке” дополнительное чувство», — говорит Владислав Агафонов, специалист Singularis Lab.

Почему о компьютерном зрении говорят всё чаще

Современные вычислительные мощности устройств, которыми мы пользуемся ежедневно, позволяют очень быстро использовать энергоёмкие алгоритмы компьютерного зрения. Это повлекло за собой значительный рост разработок во многих сферах: автопилот на автомобилях, игры с дополненной реальностью или системы контроля качества изделий на заводе.

«Развитие компьютерного зрения — одно из основных направлений ИТ-сферы. То, что еще лет 5 назад казалось научной фантастикой, скоро станет реальностью», — считает Дмитрий Крыжановский, директор компании Singularis Lab.

Кадр из сериала Terminator: The Sarah Connor Chronicles

Подтверждения можно найти в новостях. Компьютерное зрение тесно связано с машинным обучением, искусственным интеллектом и робототехникой, что в сумме даёт около 2,5 млн публикаций в новостных поисковиках Google и «Яндекс» и тысячи новых статей ежедневно.

С чего всё началось

Простейшие алгоритмы компьютерного зрения придуманы ещё 50 лет назад. Однако слабые вычислительные ресурсы не позволяли применять их для сложных задач. Поэтому учёным из 70-х годов пришлось запечатать труды и ждать, пока появятся мощные машины для обработки больших данных.

Кому это нужно


Выделяют несколько направлений, где уже применяются технологии компьютерного зрения:

  • Робототехника — навигация умных машин;
  • Автомобилестроение — автопилот в машинах;
  • Космос — система навигации и посадки для непилотируемых космических миссий, поиск астрономических объектов;
  • Медицина — проверка рентгеновских снимков;
  • Развлекательная индустрия — дополненная реальность в играх;
  • Системы взаимодействия — устройство ввода для взаимодействия между человеком и машиной;
  • Организация информации — структурная классификация и хранение больших данных;
  • Безопасность — автоматическое отслеживание опасных и потенциально опасных людей, поиск человека по базе данных, слежение за оставленными вещами;
  • Промышленность — управление производственными процессами, контроль качества изделий, доступ людей в запрещенные зоны.

Когда речь зашла о шансах малого и среднего бизнеса в области компьютерного зрения, то каждый из экспертов однозначно заявил, что тем, кто ищет интересную и развивающуюся нишу, стоит не бояться конкуренции с гигантами индустрии. Пример успеха — нижегородская компания iTseez, создатель библиотеки OpenCV, которая теперь лежит в основе многих решений в области компьютерного зрения. В мае этого года iTseez была выкуплена компанией Intel.

«Корпорации ориентируются на востребованные рынком решения (системы безопасности, системы аналитики в области ритейла, системы машинного зрения, которые управляют технологическими процессами, поиск по изображениям) и редко рискуют, чтобы создавать что-то принципиально новое. Малому и среднему бизнесу стоит создавать то, на что не обращают внимание индустриальные гиганты. Потребности рынка всегда больше, чем могут удовлетворить крупные корпорации», — заметил Александр Катанов, спикер летней школы.

Что будет дальше

Эксперты сходятся в одном: компьютерное зрение навсегда изменит мир. Индустрия двигается в сторону извлечения как можно большего объёма полезной информации из изображений, повсеместного внедрения видеонаблюдения и видеоаналитики, моментального поиска по изображениям (людей — по лицам, машин — по номерам и т. д.), увеличения графических данных в сети.

Технологии распознавания лиц уже помогают отслеживать и ловить преступников. С другой стороны, с помощью тех же технологий можно организовать тотальную слежку планетарного масштаба, что навсегда сотрет грани личной жизни и конфиденциальности.

Перспективы в России

Дмитрий Крыжановский, директор Singularis Lab, считает, что влияние компьютерного зрения на экономику, социальную сферу и нашу повседневную жизнь будет огромным: «Очевидно, что те компании, те страны, которые будут развивать эти технологии и добиваться в них успехов, получат гигантское конкурентное преимущество. США имеют возможность выступать в роли мирового гегемона именно благодаря тому, что они владеют технологиями, многие ключевые для нашей сегодняшней жизни изобретения запатентованы американскими компаниями. И здесь встаёт вопрос: а что дальше, есть ли у России и российских компаний шанс занять достойную нишу на этом новом рынке?»

Он отметил, что для успеха российских компаний в области компьютерного зрения нужны высококлассные специалисты — а значит, и преподаватели, которые будут их учить с полной отдачей. Но шансы, что такой преподаватель задержится в стенах вуза, малы: он легко найдёт работу с зарплатой не меньше $1500 в месяц (это скромный нижний предел). «Компании будут его с руками отрывать, и не только российские. Очевидно, что рано или поздно такой преподаватель оставит вуз и уйдёт работать в индустрию», — комментирует Дмитрий Крыжановский.

При достойном уровне зарплат в университетах вузы могли бы эффективнее подготавливать профессионалов. Но, по словам Дмитрия, образование — не единственная проблема. В России не хватает условий для инновационной деятельности, создания новых технологических компаний и запуска крупных проектов. А это уже тема для отдельного исследования.


Читайте по теме:

8 крутых русских стартапов в области искусственного интеллекта

18 проектов Илона Маска: куда идут инвестиции технопредпринимателя

15 самых перспективных стартапов в области искусственного интеллекта

Искусственный разум от Google заговорил. И это женщина

Видео по теме:


comments powered by Disqus

Подпишитесь на рассылку RUSBASE

Мы будем вам писать только тогда, когда это действительно очень важно