Нейросети «Яндекса» расшифруют архивные записи со сложной дореволюционной орфографией
На сервисе «Яндекса» «Поиск по архивам» можно расшифровать записи со сложной дореволюционной орфографией. В открытом доступе — свыше 2,5 млн страниц исторических документов с текстовой расшифровкой. Сервис справляется с расшифровкой за пару секунд. Об этом RB.RU рассказали в пресс-службе компании.
Новый алгоритм, построенный на основе системы оптического распознавания символов, учитывает особенности почерка, узнает утратившие актуальность буквы и понимает особую структуру архивных документов.
Первым представленным в сервисе фондом стал Главархив Москвы — именно на его материалах разработчики обучали нейросеть. Теперь база пополнилась документами из архивов Оренбургской и Новгородской областей. Со временем количество хранилищ и доступных отсканированных файлов будет увеличиваться.
«Поиск по архивам» повысит эффективность работы историков, социологов, демографов, генеалогов и поможет тем, кто ищет сведения о своей семье.
Среди документов — метрические книги, исповедные ведомости, ревизские сказки с результатами переписи населения XVIII – начала XX веков.
Записи можно найти по каталогу или через строку поиска. Есть фильтры по годам, архивам, фондам и описям. Рядом со сканом каждой страницы отображается построчная расшифровка, сделанная нейросетями «Яндекса». Если навести курсор на нужный фрагмент, он сразу подсветится и на цифровой копии.
Фото на обложке: DigitalAssetArt /
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Популярное
Как получить больничный, если вы не больны
VPN-приложения для доступа к российским сервисам за границей
Материалы по теме
-
Пройти курс «Подбор и адаптация сотрудников»
- 1 «Яндекс» запустил новую линейку генеративных нейросетей YandexART У платных подписчиков будет безлимит на генерацию картинок и видео 20 марта 14:56
- 2 Машинное обучение и большие данные: как они связаны? Прежде чем данные смогут «обучить» алгоритмы машинного обучения, они проходят этапы 19 марта 06:30
- 3 Топ-7 идей Data Science проектов — пет-проекты и примеры анализа данных Полезные проекты на каждый день 03 марта 18:55
- 4 Чем различаются слабый, сильный и супер-ИИ Широко распространен только один из них 27 декабря 20:50