Людмила Чумак

Google сделал большой шаг в обучении компьютера человеческой речи

Deep Mind, подразделение Google, объявило о том, что сделало большой шаг в развитии компьютерной речи, приближая тот день, когда компьютеры заговорят «естественно». Об этом рассказало издание Financial Times, ссылаясь на блог компании.


Материал относится к рубрике «Технологии, которые меняют ваш бизнес». В ней мы популярно рассказываем о технологиях, которые перестраивают существующие бизнес-процессы и создают новые рынки.

Партнер рубрики — корпорация EMC, которая помогает компаниям эффективно использовать возможности ИТ-инфраструктуры для цифровой трансформации бизнеса.

Британские исследователи тестируют технологию на базе искусственного интеллекта, стремясь уменьшить разрыв между современными компьютерными системами и человеческой речью. Технология получила название WaveNet, и на данный момент не используется в продуктах Google. Обусловлено это тем, что генерация речи требует больших вычислительных мощностей, и в данный момент это не практично, хотя допустимо в обозримом будущем.

Существующие системы используют уже готовые записи голоса, пересобирая их в нужном порядке. WaveNet от них отличает то, что она сосредоточена на производстве звуковых волн, а не самой речи. Используя нейронные сети, технология анализирует исходящие формы волн и пытается моделировать близкие к ним модели. Приходится принимать как минимум 16 тысяч форм образцов сигналов, что и создает огромные массивы данных.

Исследователи из DeepMind говорят: «Развитие подобной технологии позволит людям общаться с машинами, что является давней мечтой человечества». По их словам, DeepMind уже моделировал человеческие голоса, а также генерировал короткие фортепьянные композиции на основе анализа классической музыки.


comments powered by Disqus

Подпишитесь на рассылку RUSBASE

Мы будем вам писать только тогда, когда это действительно очень важно