Олег Овечкин

Ученым удалось обойти одно из главных ограничений нейросетей

Специалисты проекта Google DeepMind создали нейросеть, которая может запомнить объект или слово на основе единственного примера, а не многих тысяч повторений, как это обычно происходит при обучении нейросетей, пишет MIT Technology Review со ссылкой на подробное описание исследования.


Материал относится к рубрике «Технологии, которые меняют ваш бизнес». В ней мы популярно рассказываем о технологиях, которые перестраивают существующие бизнес-процессы и создают новые рынки.

Партнер рубрики — корпорация EMC, которая помогает компаниям эффективно использовать возможности ИТ-инфраструктуры для цифровой трансформации бизнеса.

Как отмечает издание, требовательность нейросетей к объему данных, необходимых для успешности глубокого обучения (deep learning), приводит к тому, что сам процесс обучения становится долгим и дорогим. В случае с алгоритмами, которые должны работать быстро – например, с автопилотом самоуправляемой машины, которому необходимо сразу распознавать свое окружение, многочасовое обучение представляется нецелесообразным.

Группа исследователей в Google DeepMind нашла способ обойти это ограничение, добавив нейросетям внешнюю память – таким образом, сделав их более похожими на традиционные компьютеры. Использовав это и еще несколько нововведений, ученые испытали получившуюся нейросеть на базе изображений ImageNet.

Хотя нейросети все же требовалось предварительно проанализировать несколько сотен категорий изображений, после этого она могла учиться распознавать (определять категорию) новых объектов – к примеру, собак – на основе единственного примера. Точность распознавания при этом приближалась к точности обычных нейросетей, которым требуются тысячи примеров.

Опираясь на вспомогательные данные во внешней памяти, такая нейросеть также смогла правильно определять недостающие слова в предложениях, что, по словам исследователей, может оказаться полезным для использования в поисковике Google.

Как отмечает MIT Technology Review, подобные системы разрабатывались и ранее, однако они не были совместимы с глубинным обучением.

Опрошенные изданием ученые прокомментировали, что разработанная в DeepMind нейросеть все еще слишком далека от человеческого уровня обучаемости. Сами авторы разработки в своей статье отмечают, что при увеличении объема вспомогательных данных вычислительные процессы нейросети становятся более затратными, что накладывает определенные ограничения на применение этой разработки.

comments powered by Disqus

Подпишитесь на рассылку RUSBASE

Мы будем вам писать только тогда, когда это действительно очень важно