Как ИИ помогает по-новому интерпретировать историю

Анна Самойдюк
Расскажите друзьям
Анна Самойдюк

Последние несколько лет в исторических науках наблюдается новый тренд – попытка объединить их с анализом данных и информатикой. Историки ищут новые способы извлекать информацию из старых источников при помощи искусственного интеллекта.

Завернутое в конверт, запечатанный красным воском, завещание Катаручиа Савонарио пролежало в Государственном архиве в Венеции более 650 лет. Документ, написанный в 1351 году, никогда не был открыт. Однако для физика Фауции Альбертина он оказался отличным объектом для эксперимента.

Альбертин, работающий сейчас в Исследовательском центре Энрико Ферми в Италии, захотел прочитать завещание, не открывая его. Как? При помощи рентгена. Он направил рентген на документ для того, чтобы сфотографировать текст внутри него. Затем, используя алгоритмы, он разделил шесть страниц в цифровом виде, чтобы разборчиво воспроизвести написанные от руки слова.

Команда Альбертина пока не знает до конца, что говорится в документе. Савонарио использовал старую форму итальянского языка, что немного осложнило процесс перевода. Однако эта техника должна помочь историкам изучать тексты, не повреждая физические объекты.

Альбертин участвует в разработке большего проекта под названием «Машина времени», цель которого – создать поисковую машину вроде Google, охватывающую 2000 лет европейской истории. Для этого исследователи планируют перевести в цифровой вид и организовать архивы европейских городов в одну базу данных, объясняет Фредерик Каплан, руководящий проектом. В итоге историки смогут сканировать библиотеки закрытых томов при помощи рентгеновских техник Альбертина, отправлять сканы алгоритму распознавания текста, который разрабатывает команда, а он будет автоматически заносить текст в базу данных.

Фото: Unsplash

Каплан также надеется, что в Машина времени будет предлагать функцию отображения карт, где вы сможете рассматривать, например, парижские улицы XIX века. У них есть качественные аэрофотоснимки Парижа этой эпохи. Чтобы отобразить город в разные времена, исследователи могут использовать ИИ, обученный на исторических сведениях о городском планировании.

Огромная база данных позволит историкам изучать общественные модели в течение более продолжительных периодов времени и при больших географических масштабах. Этот проект является частью нового тренда, когда все больше историков пытаются использовать информатику и анализ данных для извлечения новой информации из старых текстов. Когда историки предлагают проекты на грантовое финансирование, «это почти всегда требование создать базу данных и сделать какой-то сетевой анализ», – утверждает историк Йоханнес Прайзер-Капеллер.

Например, историк Хильде де Вердт и ее команда создали инструмент, который автоматически помечает имена, места и время в цифровых китайских и корейских текстах. Они разработали базу данных, чтобы она могла подключаться к программному обеспечению для построения карт, и им было легче визуализировать, как люди и идеи перемещаются в пространстве и времени.

QIWI Universe 2019 проинвестирует 24 миллиона рублей для решения 8 бизнес-кейсов. Как получить свою долю?

Анализ данных защищает от субъективности – когда ученые выделяют только те случаи, которые поддерживают их взгляды. «Когда вы систематически собираете доказательства и помещаете их в базу данных, вы автоматически избегаете этой предвзятости», – говорит Прайзер-Капеллер.

Даже относительно простые проекты, основанные на данных, могут дать нам новое понимание истории. Историк Маирин МакКэррон вручную занесла 600 персонажей из текста VIII века «Церковная история народа англов» в огромную таблицу Excel. Вместе с командой она также записала каждое взаимодействие между персонажами. «У нас даже есть категория для посмертных взаимодействий. Поскольку это старые религиозные тексты, святые возвращаются к живым и творят чудеса», – объясняет она.

Фото: Unsplash

В частности, МакКэррон интересуют взаимодействия женщин в тексте. В истории женщины всегда служили «посредниками мира» – они предотвращали конфликты, выходя замуж за руководителя соседнего государства. Однако сетевой анализ открывает их более сложные роли. МакКэррон обнаружила, что трое из двенадцати наиболее социально связанных персонажей в тексте были женщинами.

Не все историки уверены в преимуществах такого подхода. «Когда я решила использовать его, я думала, он будет куда мощнее, чем оказался на самом деле», – утверждает историк Михаль Биран, которая создала базу данных и отобразила в ней социальные взаимодействия в Монгольской империи в XIII-XIV веках.

Проблемы Биран могут быть вызваны сложностью ее исходного материала. Поскольку монгольская письменность практически не дошла до нашего времени, она в основном изучает документы, написанные на языках монгольских подданных – японском, персидском и русском. В разных языках у персонажей разные имена; даже в одном языке имя одного и того же персонажа может отличаться. Чтобы правильно разобрать имена, нужно тщательно изучать тексты; и всю информацию потом сложно отсортировать в аккуратные цифровые коробки, объясняет Биран.

Тем не менее, согласно Де Вердт, даже если текст источника легко переводится в цифровой вид, все еще нельзя полностью полагаться на анализ данных. В конечном счете, история основывается на текстах, и «чем больше вы внедряете математических процессов, тем дальше вы отходите от текста», – считает она. Чтобы действительно понять тонкости первичных документов, нужно обладать специализированными историческими знаниями.

«В истории редко можно быть в чем-то уверенным. Все субъективно. Каждый источник в некоторой степени раскрывает предвзятость автора», – утверждает МакКэррон. Однако объединив исторические источники и проанализировав их параллельно, вероятно, вы сможете отсеять некоторые предубеждения и приблизиться к истине.

Источник.


Материалы по теме:

Искусственный интеллект научился определять национальность по почерку

Как искусственный интеллект помогает расшифровывать древние архивы Ватикана

Пять проблем, которые пока не может решить искусственный интеллект

Как искусственный интеллект помогает лучше понять клиентов


В нашем Instagram @rusbase сегодня есть на что посмотреть! Подписаться

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

‡агрузка...

Комментарии

Зарегистрируйтесь, чтобы оставлять комментарии и получить доступ к Pipeline — социальной сети, соединяющей стартапы и инвесторов.
FinAdTech Moscow
23 мая 2019
Ещё события


Telegram канал @rusbase