Людмила Чумак

Google сделал большой шаг в обучении компьютера человеческой речи

Deep Mind, подразделение Google, объявило о том, что сделало большой шаг в развитии компьютерной речи, приближая тот день, когда компьютеры заговорят «естественно». Об этом рассказало издание Financial Times, ссылаясь на блог компании.


Материал относится к рубрике «Технологии, которые меняют ваш бизнес». В ней мы популярно рассказываем о технологиях, которые перестраивают существующие бизнес-процессы и создают новые рынки.

Партнер рубрики — корпорация EMC, которая помогает компаниям эффективно использовать возможности ИТ-инфраструктуры для цифровой трансформации бизнеса.

Британские исследователи тестируют технологию на базе искусственного интеллекта, стремясь уменьшить разрыв между современными компьютерными системами и человеческой речью. Технология получила название WaveNet, и на данный момент не используется в продуктах Google. Обусловлено это тем, что генерация речи требует больших вычислительных мощностей, и в данный момент это не практично, хотя допустимо в обозримом будущем.

Существующие системы используют уже готовые записи голоса, пересобирая их в нужном порядке. WaveNet от них отличает то, что она сосредоточена на производстве звуковых волн, а не самой речи. Используя нейронные сети, технология анализирует исходящие формы волн и пытается моделировать близкие к ним модели. Приходится принимать как минимум 16 тысяч форм образцов сигналов, что и создает огромные массивы данных.

Исследователи из DeepMind говорят: «Развитие подобной технологии позволит людям общаться с машинами, что является давней мечтой человечества». По их словам, DeepMind уже моделировал человеческие голоса, а также генерировал короткие фортепьянные композиции на основе анализа классической музыки.


comments powered by Disqus

Подпишитесь на рассылку RUSBASE

Мы будем вам писать только тогда, когда это действительно очень важно

Нажмите "Нравится",
чтобы читать Rusbase в Facebook