Новости / Искусственный интеллект

Артемий Лебедев записал свой голос для российского речевого синтезатора RHVoice

Ведется поиск новых женских и мужских голосов

Екатерина Кочкина
Текст:
26 августа 2020, 20:38

Российский социальный проект помощи незрячим Tiflo Host открыл лабораторию по созданию новых голосов для речевого синтезатора RHVoice. Первым продуктом лаборатории стал голос «Артемий». Речевую базу голоса записал блогер, дизайнер и путешественник Артемий Лебедев. Об этом Rusbase сообщили в пресс-службе проекта Everland, веб-разработчиком которого является основатель Tiflo Host Артем Плаксин.

«Появление “Артемия” — это, без сомнения, знаковое событие: ведь до этого последний голос “Анна” для речевого синтезатора RHVoice был создан ещё в 2015 году», — отмечает Плаксин.

Речевой синтезатор — это программа, которая переводит текст в речь. RHVoice направлен на помощь в озвучивании текста незрячим людям. Отмечается, что сейчас выбор озвучки у пользователей программы небольшой: создано 4 русских голоса, причём мужской из них — всего один. Поэтому голос «Артемий», как считают разработчики, будет востребован.

Процесс создания голоса состоит из нескольких этапов:

  • запись диктором речевой базы, состоящей по стандарту из 2458 предложений на русском языке;
  • выбор из начитанных фраз множества пар фонем и их сочетаний в словах и предложениях;
  • формирование data-файла голоса.

Tiflo Host планирует записать ещё, как минимум, шесть мужских и женских новых голосов. Для этого сейчас ведется поиск дикторов, готовых принять участие в проекте на некоммерческой основе.

«У людей должен быть выбор. Тем более, выбор из качественных голосов. Один голос может больше подойти для книг, другой для постоянной работы, третий для каких-то иных задач. Один голос будет лучше звучать на телефоне, другой на компьютере», — поясняет Плаксин.

Он добавил, что в планах также запись базы для английского языка, татарского или любого другого из существующих в RHVoice.

Голос диктора, запись которого ведется в условиях студии, должен удовлетворять нескольким требованиям:

  • он не должен быть низким;
  • голос должен звучать ровно, без ярко выраженных особенностей и интонационных всплесков;
  • в идеале голос должен быть богат обертонами.

Tiflo Host — некоммерческий социальный проект, созданный по инициативе группы незрячих программистов и веб-разработчиков, в июле 2018 года. Его работа нацелена на развитие российского сектора интернета для незрячих, адаптацию веб-сервисов и ликвидацию интернет-безграмотности среди пользователей с нарушением зрения. Проект включает в себя сервис конвертации файлов «Данные в данные», сервис для освоения веб-программирования и создания сайтов Tiflo Site и облачное хранилище Tiflo Cloud.

Фото: Photogenica

Подписывайтесь на наш Telegram-канал
Материалы по теме