Перевод при помощи ИИ изменил то, как мы общаемся, сломав языковые барьеры. По прогнозам, к 2026 году сектор вырастет до $12,3 млрд. Заработать на этом стремятся не только крупные, но и малые игроки.
Один из них — расположенный в Кёльне стартап DeepL, который в 2023 году стал единорогом. Рассказываем об истории проекта и в чем он видит свое преимущество перед Google Translate.
«Мы всегда конкурировали с большими компаниями»
DeepL появился на базе онлайн-словаря Linguee в 2017 году, и быстро рос под управлением информатика Ярослава Кутыловского, основателя и CEO стартапа.
Кутыловский родился в Польше и в 12 лет переехал в Германию, где ему приходилось посещать школу, не говоря ни слова по-немецки. Так он понял, насколько важно знание языков.
В 2017 году, начав работать над DeepL, он заметил, что нейросети могут предложить прорыв, который бы позволил решить проблему.
«Мы знали, что машинный перевод будет двигаться в этом направлении. И мы знали, что это будет невероятно полезно. Увидев возможность, мы подумали: „Эй, давай-ка сделаем что-то классное“» — рассказывает Кутыловский.
Нейронный машинный перевод (англ. Neural Machine Translation, NMT) — самый успешный метод машинного перевода, который есть на сегодняшний день. Он быстрее и точнее, чем его предшественники, использует меньше ресурсов и его легче масштабировать.
DeepL предлагает услуги по переводу с фокусом на B2B-продукты. Как сообщают в компании, с запуска они получили запросы от более чем 1 млрд пользователей, и сейчас у них более 20 тысяч бизнес-клиентов, в том числе Elsevier, Fujitsu и Mastodon.
«Перевод очень важен для бизнеса, — объясняет Кутыловский. — Сейчас компании становятся международными и быстро выходят на новые рынки, поэтому они получают клиентов из разных регионов».
Читайте по теме:
Интернет состоит из плохих машинных переводов — исследование
Новая версия Midjourney 6.0: как составлять запросы с пользой для бизнеса
Арабские ученые создали нейросеть, которая имитирует почерк человека
По его словам, больше всего переводы требуются в сферах, как используется много текстов, например в области юридических услуг.
На данный момент в арсенале DeepL 31 язык, используемый в странах Европы и Азии. В 2023 году стартап внедрил ИИ-ассистента для составления текстов и приобрел статус единорога. Несмотря на то, что сейчас финансирование получить сложнее, в январе компания привлекла неназванную сумму (оценивается в €100 млн) и достигла оценки в €1 млрд.
DeepL заявляет, что предлагает «лучший в мире» перевод при помощи ИИ, а также, что его продукт учитывает нюансы и в 3 раза точнее, чем у конкурентов. Такие результаты они получили по итогу «слепых тестов», в которых профессиональные переводчики выбирали наиболее точный вариант перевода, не зная, какая компания его выполнила.
В чем преимущество DeepL?
«Мы всегда конкурировали с большими компаниями» — отмечает Кутыловский, добавляя, что основным соперником стартапа на рынке остается Google Translate.
По его словам, одно из преимуществ стартапа — специализация: «Перевод — не ключевой бизнес Google, а всего лишь один из сотни побочных проектов. То же самое, если взглянуть на LLM и OpenAI как нашего конкурента; перевод — лишь один из примеров того, что они делают… Мы концентрируемся на одной конкретной области».
С точки зрения технологии успех DeepL основан на архитектуре нейросетей, вкладе людей-редакторов и обучающих данных.
Стартап обучает свои модели на огромном количестве данных, преимущественно собранных из интернета. Для это используются специальные программы-кролеры, которые автоматически находят переводы и оценивают их качество. Такие методы, как обучение с подкреплением, позволяют предоставлять ИИ позитивную обратную связь, чтобы он и дальше давал результаты желаемого качества.
Задача также состоит в том, чтобы найти баланс между возможностью модели переводить и способностью образовать предложения на языке перевода. «Есть много деталей, которыми занимается команда математиков» — добавляет Кутыловский.
Машинный перевод: новые вызовы и возможности
CEO DeepL признает, что недавний бум интереса к ИИ ускорил динамику в секторе и добавил сложностей.
Теперь команде нужно следить за множеством изменений: выходом новых моделей, open-source проектами, научными исследованиями и работой других компаний.
«Сейчас машинный перевод — своего рода гонка» — говорит основатель и CEO DeepL.
Какая стратегия для нее подойдет? По мнению Кутыловского, один аспект — постоянные иннновации и их правильное внедрение. Второй — правильные инвестиции. Важно получить нужный капитал и соответствующую команду.
В то же время развитие ИИ и интерес к нему открывает новые возможности: «Есть вещи, о которых мы думали 2-3 года назад, но технологий для их воплощения еще не было».
Будущее изучения языков
Машинный перевод оказал нам огромную помощь в преодолении языковых барьеров. Но при этом возникает вопрос: не достигнем ли мы точки, в которой не придется учить иностранные языки, потому что ИИ может сделать это за нас?
«С развитием ИИ в целом, думаю, людям придется спросить себя: что нам нужно учить? И что мы хотим учить?» — рассуждает Кутыловский.
По мере того, как совершенствуется технология, нам все меньше нужно будет учить языки, чтобы освоиться за рубежом. Но это не значит, что они станут менее ценными. В качестве примера основатель DeepL приводит математику: в реальной жизни мы не используем сложные вычисления из школьной программы. Однако эта наука по-прежнему необходима, ведь она учит нас рациональному мышлению.
Тот же принцип применим и к языкам, считает он. Осваивая язык, мы узнаем, как формировать мысли и выражать идеи — и это невероятно важно для нашего развития.
Обложка снегерирована нейросетью Midjourney
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
- Пройти курс «Как попасть в топ поисковой выдачи Ozon»
- 1 Китай вырвался в лидеры по количеству новых стартапов-«единорогов»
- 2 «Женский календарь» Flo привлек $200 млн и получил статус «единорога»
- 3 Стартап-единорог Sila с российскими корнями привлек $375 млн в раунде серии G
- 4 No-code-платформа Creatio привлекла $200 млн при оценке в $1,2 млрд
ВОЗМОЖНОСТИ
28 января 2025
03 февраля 2025
28 февраля 2025