ishpakovskayaslovomolhqcom

О состоянии российской индустрии расшифровки и прогрессе в распознавании речи


Услугами компаний по расшифровке на Западе активно пользуются правительственные органы, юристы, врачи, преподаватели, бизнесмены, – то есть самый широкий круг лиц.

Причина популярности сервисов по расшифровке речи в текст за рубежом — девиз «go paperless», и это касается всех сфер жизни и целого ряда отраслей, где активно осуществляется переход на электронный документооборот. Существует специализация отрасли на Западе на: medical transcription(для здравоохранения), legal transcription(для юристов), academic transciption(для научных работников, профессоров и студентов), podcast transcription(для СМИ) и другие. По данным отчета международной аналитической компании IBIS World, только в США доходы рынка расшифровки в 2012 году составили порядка 4 млрд. долл. На  рынке США действует 56 тыс. компаний по расшифровке. 


Что есть в России?

Российские разработки в области распознавания речи, по оценкам экспертов, отстают от зарубежных конкурентов. Объемы государственного финансирования научных исследований в этой области, например, в США и России, несопоставимы. Достижения исследователей долгое время не находили спроса в России, но в последнее время российские компании, развивающие научный потенциал в сфере разработок по распознаванию речи,  наращивают объем продаж разрабатываемых продуктов за счет отечественного рынка( бесспорный лидер здесь Центр Речевых Технологий, который занимается разработкой мультимодальных биометрических систем).
Программ для реального распознавания речи на русском языке практически не существует, и созданы они будут, очевидно, не скоро. 

Средняя рыночная цена расшифровки на российском рынке на сегодняшний день – 1 долл США за минуту, цены на данную услугу сравнялись с западными. Стоит ли сравнивать доходы населения и покупательную способность? На рынке расшифровки РФ действует порядка 20 компаний и толпа фрилансеров.

Официальный запуск стартапа по расшифровке русской речи в текст Slovomol уже состоялся. Проект Slovomol стартовал в апреле 2013. Стратегическая цель: выйти на международный русскоязычный рынок и грамотно построенным бизнес-процессом уменьшить стоимость услуг расшифровки, насколько это возможно, так как сложившиеся на эту услугу цены достаточно высоки и ограничивают область применения и, соответственно, рынок. Отличие Slovomol от традиционных российских компаний по расшифровке:

  • SEO-оптимизатор для проектов, работающих с аудио- и видеоданными (вебинары, видеоуроки, радиостанции и т.д.);
  • мобильный помощник для занятых людей (стенограммы встреч, надиктовка писем и заметок);
  • эффективный способ набора текстов (блогозаписи для веб-сайтов, книги для инфобизнесменов, подкастинг для онлайн-вещания). Потребность клиентов состоит в действительно быстрой расшифровке аудиозаписей и руководители проекта стремились предоставить такую возможность за счет новой идеи организации работы;
  • точная расшифровка аудио и видео в текст с использованием передовых технологий распознавания речи и последующей сверкой фрагментированных частей аудио, расшифрованных в текст;
  • Slovomol помогает поисковым машинам оценить текстовое содержание мультимедийного контента веб-сайтов благодаря интерактивным стенограммам. Google, Yandex и прочие поисковики не могут оценить уникальный медиаконтент и не будут продвигать веб-сайт по упоминаемым в видеозаписи ключевым фразам. Slovomol предлагает не просто технологичную расшифровку, но и SEO, и возможность связать стенограмму с YouTube-видеороликом и получить HTML-код для встраивания в веб-сайт, на котором данный контент размещен;
  • благодаря встроенным в интерактивные стенограммы виджетам социальных сетей Slovomol дает пользователям возможность поделиться понравившейся цитатой со своим социальным графом в любой из социальных сетей автоматически. То есть, интерактивные HTML-стенограммы Slovomol, помимо SEO-оптимизации, выполняют SMM-функцию. 

Зачем вообще нужны транскрипты:

1.Избавляют всех участников от необходимости конспектировать. 

2.Дают возможность организаторам бизнес-события эффективно вести электронный документооборот, что просто необходимо для работы в корпоративном формате.


В чем полезность интерактивных транскриптов?

1. SEO для веб-ресурсов с медиаконтентом. Поисковые системы индексируют веб-страницы с интеративными стенограммами по ключевым фразам из видео в открытом доступе.

2. SMM —  в соцсетях популярно цитирование, пользователи делятся цитатами из видео(соответственно, популяризируя сам контент и его автора). Актуально для промо-видео, видеотренингов, вебинаров и подкастинга. 

Немного статистики: Согласно научным исследованиям в IT-сфере, которые проводились Microsoft; MIT, SRI International, Department Of Defense(США);“Долгосрочный технологический прогноз Российский ИТ Foresight”,можно сделать следующие выводы:

1. транскрипты предпочтительнее для подавляющего большинства пользователей относительно аудио по скорости восприятия и запоминания материала;

2. соотношение средней скорости чтения текста и подачи того же контента в аудио 3:1 согласно исследованию;

3. видео, сопровождаемое интерактивными транскриптами (“highlited transcripts” по определению Microsoft) удобнее и выбраны большинством участников исследования;

4. полноценное распознавание слитной русской речи является перспективным направлением развития IT-сферы, но, по самым оптимистичным прогнозным оценкам, появится не ранее 2016 года (российский IT Foresight, подготовлен Минкомсвязи РФ, принимали участие 138 представителей государственных органов, науки и бизнеса, являющихся экспертами в области ИКТ. Среди них – 135 российских и 3 зарубежных эксперта).


comments powered by Disqus

Подпишитесь на рассылку RUSBASE

Мы будем вам писать только тогда, когда это действительно очень важно