Колонки

ML для анализа документов: какие сервисы помогают бизнесу сейчас и почему технология пока не так широко распространена

Колонки
Диана Хакимова
Диана Хакимова

Юрист-аналитик в Embedika

Ирина Печёрская

Диана Хакимова, юрист-аналитик Embedika, компании, которая занимается созданием сложных автоматизированных систем для работы с документами, рассказала, как технология ML помогает в анализе юридических документов и какие барьеры ограничивают ее повсеместное внедрение.

ML для анализа документов: какие сервисы помогают бизнесу сейчас и почему технология пока не так широко распространена
Как создавать продукты, которые хотят все — по ссылке

650 договоров или 100 претензионных и исковых дел — по мнению Министерства труда, именно такой объем работы может ежегодно выполнять квалифицированный юрист в России. Нормы труда, которые определило ведомство, носят рекомендательный характер и служат для расчета численности сотрудников юридических служб.

При этом предписания государства не соответствуют реальному положению дел в юридической сфере: например, у многих юристов в трудовом договоре прописан ненормированный рабочий день. 

Перегрузки и переработки юристов встречаются не только в России. Так, в Америке специалисты юридических департаментов могут работать по 60-70 часов в неделю, вести дела в выходные и праздничные дни. В Австралии 57% сотрудников юридических служб тратят на переработки до 10 часов в неделю, 21% — 15 часов, 10% — 20 часов. В Великобритании юристы обычно приходят на работу в девять утра, а уходят из офиса после 20 вечера.

Несоблюдение режима work-life balance ведет к допущению серьезных ошибок в договорах, что может стоить компании не одну тысячу долларов. К примеру, два года назад невнимательность юриста, который не проверил контрагента, обошлась одной российской организации в 13 млн рублей.

В сфере же малого бизнеса предпринимателям приходится или самостоятельно решать юридические вопросы, сталкиваясь с административными барьерами и частой сменой законодательства, или передавать решение этих вопросов сторонним экспертам, или брать специалиста в штат. В обоих случаях предпринимателю не избежать финансовых потерь и временных затрат на решение юридических задач.

Помочь бизнесу призваны новые технологии. Огромное внимание уделяется внедрению технологии машинного обучения (ML). По мнению экспертов, ML повысит эффективность выполнения многих юридических задач. Например, при помощи машинного обучения можно будет быстро проверить контракт на наличие нежелательных формулировок: у обычного человека на эту операцию может уйти до нескольких часов, а машина справится с задачей за пару минут.

 

Какие legaltech-решения существуют в России и за рубежом

С каждым годом в отрасли появляется все больше продуктов, использующих технологию машинного обучения. Особенно стремительно решения LegalTech развиваются за рубежом. Самым известным из них является система Kira — программа для анализа договоров. 

Применяя технологию машинного обучения, Kira извлекает и подсвечивает положения, которые наиболее важны в том или ином контракте, помогает найти основную значимую информация для анализа документа. Сегодня систему Kira использует огромное число юридических фирм и юридических департаментов крупных корпораций. К примеру, сервис внедрен в работу таких лидеров рынка, как Delloite, Hogan Lovells, Bennett Jones.

Еще один инструмент, который может помочь в работе, — сервис CARA. Программа вычитывает документы, с которыми работает специалист, и находит аналогичные случаи в юридической практике, приводит релевантные решения суда, дает ссылки на необходимые постановления и законы. 

Сервисы, аналогичные Kira и CARA, есть и в России. Например, в прошлом году «Сбер» запатентовал систему для проверки юридических лиц на правоспособность. Работа сервиса основана на базе искусственного интеллекта, что позволяет избегать ошибок, которые часто появляются при ручной обработке информации.

Как отмечает пресс-служба компании, процесс анализа юридического лица производится комплексно: система проверяет порядка 10 документов, время, которое тратится на эту задачу, составляет около семи минут.

Еще один сервис мы в Embedika разрабатываем совместно с юридическим департаментом российского подразделения компании Siemens. Это экспериментальное решение для проверки юридических документов. Используя принцип машинного обучения, программа выделяет в тексте условия, регулирующие гражданско-правовую ответственность: неустойки, штрафы, возмещение ущерба, убытки, возмещение потерь. На эти моменты система советует обратить внимание перед заключением договора. 

Степан Зайцев, директор по правовым вопросам Siemens в России: «Наши специалисты вручную разметили около 80 договоров, выделив в них нужные условия. На основе этих данных машина обучилась определять и вычленять риски, которые встречаются в подобных документах.

В перспективе это позволит значительно упростить и автоматизировать работу юридической службы крупных компаний, а также юристов среднего и малого бизнеса, для которых внедрение дорогостоящих технологичных решений пока недоступно. В настоящий момент мы продолжаем работу над развитием и улучшением сервиса, сегодня принять участие в его тестировании может любой желающий».

 

Почему внедрение legaltech-решений пока не стало повсеместным 

 

Дороговизна

На сегодняшний день внедрение машинного обучения для большинства компаний остается дорогим удовольствием. Использовать ML могут себе позволить только крупные игроки рынка. Компаниям с небольшим штатом проводить анализ документов по-прежнему выгоднее вручную. 

Кроме того дополнительная сложность применения ML заключается в том, что у каждой компании свои правила проверки документов. Даже внутри одной организации могут действовать разные регламенты работы с договорами. Следовательно, каждый раз нужно дообучать машину на основе документов и запросов фирмы. Это значительно увеличивает стоимость внедрения ML в работу компании.

 

Проблема настройки баланса полноты и точности

Существующие инструменты анализа юридических документов позволяют либо найти больше данных и загрузить эксперта лишней информацией, либо найти меньше данных и пропустить важный фрагмент договора. Результат обработки зависит от соотношения коэффициентов полноты и точности.

По мнению руководителя R&D Embedika Геннадия Штеха, единого решения данной проблемы до сих пор не выработано. Один из возможных инструментов повышения точности — предварительная обработка результатов работы алгоритмов вручную до передачи эксперту на разметку. 

Еще один способ получить более полные и точные результаты анализа — изменить подход к проектированию интерфейсов для вычитки документов. Например, ввести показатели уверенности модели машинного обучения. Так, даже если алгоритм выделит неважный фрагмент документа, за счет невысокого процента уверенности пользователь сможет разобраться, что рассматриваемая формулировка не так опасна. Дополнительно можно сделать подсказки и рекомендации.

 

Специфика юридических текстов

Компьютер довольно неплохо анализирует отдельные условия договора. При этом у машины возникают ошибки, если в контракте используются схожие по звучанию, но противоположные по значению формулировки. Объяснить эту разницу алгоритму машинного обучения сложно. 

Внедрение списка ручных правил и использование дополнительных ключевых слов должно помочь решить эту проблему. Программа будет автоматически проверять фрагменты, которые нашел алгоритм, на наличие тех или иных ключевиков и разделять их по заданным параметрам на более узкие категории. Однако это потребует выработки тысячи новых правил, что окажется крайне трудозатратно для разработчиков.

 

Проблема принятия решений

Когда машина что-то подсвечивает в документе, она уже подталкивает человека к принятию определенного решения. Вероятно, если бы юрист проверил сам, то не стал бы использовать формулировку, которую ему рекомендует программа. Конечно, для работы с договором это не имеет большого значения, но ставит под сомнение применение ИИ в судопроизводстве. 

Например, в настоящий момент в американских судах активно используются специализированные скоринговые системы, которые оценивают вероятность совершения рецидива у осужденных. Рейтинги, присваиваемые данными программами, судьи учитывают при назначении наказания, а также при вынесении решений об условно-досрочном освобождении. Однако объективность данной оценки уже подвергалась критике и была поставлена под вопрос в деле Loomis v. Wisconsin

 

Итак, мы полагаем, что инструменты с ML будут все активнее внедряться в юридическую сферу, но машина не будет принимать решения. Средства автоматизации улучшат условия труда юристов и дадут возможность заниматься более интересной и менее рутинной работой.

Появятся специалисты, чья аналитика способна обогатить искусственные оценки экспертным знанием. Пока технологии развиваются, программы будут дорабатываться при помощи внедрения других инструментов: добавления ручных правил, использования и классификации ключевых слов.

Однако для малого бизнеса внедрение кастомизированных решений на основе машинного обучения станет доступно еще не скоро. Тем не менее есть положительные тенденции в решении этой проблемы — развитие сотрудничества ИТ-компаний, обладающих необходимыми компетенциями, с крупными корпорациями и юридическими фирмами, располагающих огромным объемом данных. 

Работая вместе, они берут на себя расходы на аналитику и разработку. В результате топовые специалисты передают часть своей экспертизы программе, которую стартапы и индивидуальные предприниматели смогут приобрести по более низкой стоимости.

Фото на обложке: Billion Photos/shutterstock.com

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 Сравнить, распознать, конвертировать: 7 сервисов для работы с документами
  2. 2 Электронный документооборот: как избавиться от возни с бумажками
  3. 3 Ссылка дня: бесплатный сервис проверки зарубежных контрагентов на основе ИИ
FutureFood
Кто производит «альтернативную» еду
Карта