Нейросети «Яндекса» расшифруют архивные записи со сложной дореволюционной орфографией
Сервис справляется с задачей за несколько секунд
На сервисе «Яндекса» «Поиск по архивам» можно расшифровать записи со сложной дореволюционной орфографией. В открытом доступе — свыше 2,5 млн страниц исторических документов с текстовой расшифровкой. Сервис справляется с расшифровкой за пару секунд. Об этом RB.RU рассказали в пресс-службе компании.
Новый алгоритм, построенный на основе системы оптического распознавания символов, учитывает особенности почерка, узнает утратившие актуальность буквы и понимает особую структуру архивных документов.
Первым представленным в сервисе фондом стал Главархив Москвы — именно на его материалах разработчики обучали нейросеть. Теперь база пополнилась документами из архивов Оренбургской и Новгородской областей. Со временем количество хранилищ и доступных отсканированных файлов будет увеличиваться.
«Поиск по архивам» повысит эффективность работы историков, социологов, демографов, генеалогов и поможет тем, кто ищет сведения о своей семье.
Среди документов — метрические книги, исповедные ведомости, ревизские сказки с результатами переписи населения XVIII – начала XX веков.
Записи можно найти по каталогу или через строку поиска. Есть фильтры по годам, архивам, фондам и описям. Рядом со сканом каждой страницы отображается построчная расшифровка, сделанная нейросетями «Яндекса». Если навести курсор на нужный фрагмент, он сразу подсветится и на цифровой копии.
Фото на обложке: DigitalAssetArt /
-
Бизнес Екатерина Лапшина: «У меня всегда был чуть больший аппетит к риску» 07 мая 2026, 16:10
-
Бизнес Командировки в 2026 году: как экономить на деловых поездках, не жертвуя комфортом сотрудников 13 мая 2026, 10:00
-
Бизнес Куда идут деньги инвесторов и почему российскому бизнесу стало сложнее их привлекать 12 мая 2026, 15:22
-
Технологии Александр Пьянов, «Яндекс Драйв»: «Мы готовы стать агрегатором для всего рынка каршеринга» 08 апреля 2026, 12:26
-
Личное Из фарцовщика в создателя дизайн-завода Flacon: как Николай Матушевский дважды бросал свой бизнес и начинал с нуля 05 мая 2026, 12:09
-
Деньги Налоговый вычет через личный кабинет в 2026 году: пошаговая инструкция 24 апреля 2026, 21:57
-
Деньги Ключевая ставка ЦБ РФ в 2026 году: текущий показатель и как он влияет на экономику 23 апреля 2026, 20:19
-
Маркетинг Как брендам достучаться до зумеров: почему старые инструменты больше не работают и что делать 12 апреля 2026, 22:11
-
Бизнес В России хотят создать «защитные зоны» вокруг дата-центров — строительство жилых домов на их территории ограничат 13 мая 2026, 20:30
-
Технологии «Моторика» запускает мобильные кабинеты протезирования — врачи смогут изготавливать изделия в отдалённых регионах 13 мая 2026, 20:11
-
Бизнес Anthropic и OpenAI запретили вторичную торговлю акциями — неодобренные компаниями сделки признают недействительными 13 мая 2026, 21:05
-
IT За 5 лет рост инвестиций в ИТ и телеком замедлился: эксперты связывают это с отменой льгот и дефицитом кадров 13 мая 2026, 21:00
-
Искусственный интеллект Российские ведомства планируют использовать для работы зарубежный ИИ: в топе по популярности — Qwen и модели Meta* 13 мая 2026, 19:50
-
Россия «Итальянские недели» возвращаются: «Вкусно — и точка» запустит новое тематическое меню с 28 мая 13 мая 2026, 17:20
-
Бизнес OpenAI обвинила Илона Маска в попытке использовать ресурсы компании — для строительства города на Марсе 07 мая 2026, 09:00
-
Тренды Гендерный разрыв зарплат в России достиг максимума за 13 лет — мужчины зарабатывают на 34% больше женщин 07 мая 2026, 15:00
