Ученые научились переводить сигналы мозга в распознаваемую речь
Но до чтения мыслей все еще далеко
При помощи технологии сканирования мозга, искусственного интеллекта и синтезаторов речи ученые смогли преобразовать сигналы в мозга в понятную вербальную речь. Вполне вероятно, благодаря этому открытию в будущем у людей, потерявших способность говорить, появится голос.
Новое исследование, опубликованное в журнале Scientific Adventures, помогло нам приблизиться на один шаг к этой цели. Нейробиолог Нима Месгарани и его коллеги объединили недавние достижения в машинном обучении с технологиями синтеза речи: их нейрокомпьютерный интерфейс – пусть все еще и элементарный – захватывал сигналы мозга непосредственно из слуховой коры, и затем их расшифровывал вокодер на базе ИИ.
Важно отметить, что технология не читает мысли человека. К сожалению, науке до этого еще далеко. Вместо этого она анализирует мозговые волны, образовавшиеся после прослушивания чужой речи.
Для исследования пригласили пять пациентов-добровольцев, проходящих лечение от эпилепсии, поскольку им часто делают операции на мозг. Команда при помощи инвазивной электрокортикографии измерила их нейронную активность во время прослушивания непрерывных речевых звуков. Пациенты слушали, например, как человек считает от нуля до девяти. Затем данные отправлялись в вокодер, который переводил их в синтезированные слова. Конечно, речь была роботизированной, но все равно понятной. Для оценки результатов ученые пригласили одиннадцать человек с отличным слухом; они смогли правильно распознать слова примерно в 75% случаев, иногда они даже определяли пол говорящего! Месгарани поделился, что такой хороший результат стал для него сюрпризом. Записи синтезированной речи можно найти здесь.
Использование синтезатора голоса в противовес системе, которая может объединять и производить предварительно записанные слова, важно для Месгарани. Он объяснил, что речь – это не просто объединение слов в одно предложение.
Нима Месгарани. Фото: The Pine Tree
«Поскольку цель этой работы – дать людям, которые потеряли способность говорить, возможность общаться с другими, мы стремились изучить прямую связь мозговых сигналов с речью. Мы можем расшифровывать фонемы или слова, однако в речи есть и другие важные аспекты, помимо содержания – например, интонация, эмоциональная окраска и так далее. Таким образом, в данном исследовании мы хотим восстановить сам звук».
В будущем Месгарани хотел бы синтезировать более сложные слова и предложения и научиться читать и воспроизводить мысли при помощи технологии.
Профессор нейроинтерфейсов в Ньюкаслском университете Эндрю Джексон был впечатлен новым исследованием, но ему все еще неясно, можно ли будет применить этот подход напрямую к нейро-компьютерным интерфейсам.
«В исследовании расшифрованные сигналы отображают реальные слова, услышанные мозгом. Чтобы приносить пользу, технологии необходимо будет научиться расшифровывать слова, которые пользователь представил у себя в уме. Несмотря на то, что между областями мозга, участвующими в слушании, говорении и представлении речи, часто есть некоторые совпадения, мы все еще не знаем, насколько похожими будут соответствующие сигналы мозга», – сказал он.
Уильям Татум, невролог в Клинике Mayo, также не принимавший участие в исследовании, сказал, что работа ученых важна, поскольку они первыми использовали искусственный интеллект в таком контексте. «Это открытие стимулирует применение техник глубокого обучения в системах воспроизведения речи в будущем», – сказал он.
Тем не менее, он считает, что участников было слишком мало, и данные, полученные во время операции на мозг, не совсем идеальны.
Еще одно ограничение заключается в том, что нейронные сети нужно обучать на огромном количестве мозговых сигналов каждого участника в отдельности. Система индивидуальна для каждого пациента, поскольку все мы производим разные волны мозга, когда слушаем речь. Интересно будет посмотреть, насколько хорошо декодеры, обученные на конкретных людях, будут применимы ко всем.
Без сомнений, работы все еще много. Однако новое исследование – важный шаг к достижению имплантируемого нейропротеза речи.
Материалы по теме:
7 удивительных примеров использования CRISPR в реальной жизни
Телепортация: реально ли перемещаться на тысячи километров?
Ученые смогут вырастить из мицелия все — от имитации мяса до искусственных органов
Ради эксперимента ученые наблюдали за часами 14 лет. Вот что они выяснили
-
Личное Фёдор Овчинников: «Пять месяцев в тундре — путешествие в другое измерение» 14 мая 2026, 13:18
-
Бизнес Екатерина Лапшина: «У меня всегда был чуть больший аппетит к риску» 07 мая 2026, 16:10
-
Банки Владимир Скворцов: «Наша задача — снизить страховые риски клиента и быстро выплатить, если что-то случится» 19 мая 2026, 16:00
-
Технологии Александр Пьянов, «Яндекс Драйв»: «Мы готовы стать агрегатором для всего рынка каршеринга» 08 апреля 2026, 12:26
-
Банки Ирина Лебедева, Т2: «Ключевой принцип — без неприятных сюрпризов» 25 марта 2026, 09:14
-
Личное Из фарцовщика в создателя дизайн-завода Flacon: как Николай Матушевский дважды бросал свой бизнес и начинал с нуля 05 мая 2026, 12:09
-
Бизнес Сергей Косинский: «Мне достался Франкенштейн, из которого попросили сделать нормального человека» 02 февраля 2026, 19:51
-
Личное «Успешным я стану, продав бизнес и уехав в Африку реабилитировать горилл». Интервью с ресторатором Денисом Бобковым 10 апреля 2026, 17:00
-
Технологии Минпромторг может ввести требования по локализации дата-центров: аналитики предупреждают — появление ЦОД замедлится 21 мая 2026, 13:00
-
Искусственный интеллект Google внедрил ИИ в поисковую строку — это одно из самых масштабных обновлений компании за последние 25 лет 20 мая 2026, 19:45
-
Искусственный интеллект Греф заявил о планах Сбера перейти на китайские чипы для GigaChat: ранее компания использовала микросхемы от Nvidia 20 мая 2026, 19:00
-
Искусственный интеллект Google представила новые умные очки — устройства получат аудиоуправление на базе ИИ Gemini 20 мая 2026, 16:15
-
Бизнес Не менее 15 компаний проведут IPO на Мосбирже в 2026 году: часть из них находится в «продвинутой стадии» подготовки 21 мая 2026, 16:00
-
Бизнес OpenAI может подать документы на IPO уже 22 мая — компания рассчитывает выйти на биржу в сентябре 21 мая 2026, 13:45
-
IT «Теперь все ищут не единорогов, а рабочих лошадок»: IT-рынок вошёл в зрелую стадию — инвестиции стали прагматичнее 21 мая 2026, 12:00
-
Бизнес VK опубликовала финансовые результаты за I квартал 2026 года — чистый долг компании сократился на 20 млрд ₽ 21 мая 2026, 11:20
