11 февраля на вебинаре в рамках проекта AI Heroes основатель Eora Рома Доронин и руководитель направления computer vision Влад Виноградов рассказали о своей платформе VisionHub — маркетплейсе моделей компьютерного зрения, а также о том, где и как можно применять эту технологию.
Компьютерное зрение — это направление в ИИ, которое применимо в огромном числе сфер: от медицины до безопасности. Алгоритмы компьютерного зрения работают по аналогии с человеческими глазами.
Основные направления компьютерного зрения:
- детекция,
- распознавание объектов,
- трекинг объектов,
- задачи из области обработки и восстановления изображений.
Проблемы в сфере искусственного интеллекта
Проблем в сфере ИИ множество. Именно этим объясняется такое малое количество реальных кейсов. Сложности проявляются на этапах:
- сбора данных,
- обработки данных,
- расчета стоимости решения,
- обслуживания,
- дообучения моделей,
- извлечения метрик точности работы, так как метрики не только меняются от камеры к камере, но и деградируют со временем.
Применение компьютерного зрения в повседневной жизни
Компьютерное зрение применяется в разных сферах.
Пример 1. Медицина
Система, помогающая врачам детектировать опухоли на снимках. Как результат, быстрая и точная работа врачей при первичной проверке.
Пример 2. Магазины одежды
Искусственный интеллект в роли модельера. Анализ примеров одежды и генерация собственных вариантов.
Пример 3. Коммунальные службы
Камеры и микрофоны на фонарях анализируют текущую ситуацию. Как результат, детекция драк, выстрелов, звуков битого стекла.
Пример 4. Телевидение
Разделение видео телепередач на блоки и генерация названия блока. Определение «перебивок» между блоками на видео- и аудиоряде, генерация названия на основе текста.
Пример 5. Химия
Распознавание нарисованной молекулы и перевод в формулу. Распознавание атомов и связей, составление молекул в цифровом формате.
Пример 6. Банки
Чат-бот с возможностью верификации пользователя по лицу. Благодаря этому функционалу он отвечает на вопросы пользователей и дает возможность производить оплату.
Все эти модели уже работают и представлены на платформе VisionHub.
Трудности, с которыми сталкиваются разработчики и заказчики
Перед заказчиками стоит задача правильной формулировки запроса, отбора разработчиков и интеграторов для внедрения систем computer vision. Разработчикам сложно объединить несколько моделей на одном видеопотоке.
Например, есть видеопоток с камеры. Изначально необходимо реализовать модель распознавания лиц. Далее — подключить модель распознавания касок. Далее — добавить модель распознавания падений, модель детекции пожара и любые другие. Необходимо прописывать логику моделей непосредственно под каждую камеру.
Для нового скачка в области computer vision необходима демократизация AI, то есть упрощение внедрения и кратное снижение стоимости таких решений, что позволит им выйти на новую экономическую эффективность.
Решения
На рынке существуют отлаженные модели в руках у команд разработчиков и компаний. Также есть решение в виде платформы Eora VisionHub — это маркетплейс готовых моделей машинного обучения. Его задача — объединить разработчиков, интеграторов и заказчиков для простого внедрения систем computer vision.
Особенность платформы заключается в возможности объединения нескольких моделей на одном видеопотоке. Логику моделей можно прописать под каждую камеру за пару кликов.
Как получить максимум от computer vision
- Убедитесь, что вы готовы к внедрению ИИ.
- Поймите, в какой области вашего бизнеса ИИ будет наиболее полезен.
- Посчитайте, в каком случае ИИ оправдает затраты.
- Найдите команду компетентных разработчиков или воспользуйтесь готовым решением.
- И шагайте навстречу новым интеграциям!
Фото на обложке: Shutterstock / Lidiia
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
ВОЗМОЖНОСТИ
10 сентября 2024
10 сентября 2024
10 сентября 2024