Top.Mail.Ru
Истории

Карен Спарк Джонс – исследовательница, чьи работы легли в основу современных поисковиков

Истории
Анна Самойдюк
Анна Самойдюк

Ex-редактор направления «Истории».

Анна Самойдюк

В то время как большинство ученых пытались взаимодействовать с компьютерами при помощи кода, Карен Спарк Джонс научила их понимать человеческий язык. Ее технология стала основой поисковых машин вроде Google.

Карен Спарк Джонс – исследовательница, чьи работы легли в основу современных поисковиков

«Многие вещи, над которыми она работала, долгое время казались нонсенсом, а сейчас мы воспринимаем их как должное», – сказал ее друг Джон Тэйт, работающий сейчас с Британским компьютерным сообществом.

Опубликованная в 1972 году в Journal of Documentation статья Джонс заложила основу для современной поисковой системы. В ней она объединила статистику с лингвистикой – необычный для того времени подход – чтобы создать формулы, воплощающие принципы того, как компьютеры могут интерпретировать отношения между словами. К 2007 году почти каждая поисковая машина использовала эти принципы.

Джонс родилась 26 августа 1935 года в Хаддерсфилде – небольшом английском городе, где производят текстиль. Ее отцом был Оуэн Джонс – преподаватель химии, а матерью – норвежка Ида Спарк, переехавшая в Великобританию во время Второй мировой войны.

Джонс изучала историю, а затем философию в Кембридже. Там она познакомилась с руководительницей факультета исследования языка Маргарет Мастерман, которая вдохновила ее сменить специальность. Вскоре она вышла замуж за информатика Роджера Нидхема.

Джонс начала работать на Мастерман. Она хотела понять, как запрограммировать компьютер, чтобы он понимал слова, которые имеют несколько значений (например, «область»), и поставила перед собой цель запрограммировать большой тезаурус.

Фото: The New York Times

«У всех слов в нашем языке есть несколько значений. Как определить, какое из них они имеют в определенной ситуации?» – поделилась своими размышлениями она в одном из интервью.

В 1964 году она опубликовала работу «Синонимия и семантическая классификация», которая является сейчас основой обработки естественной речи. В 1972 году Джонс ввела концепцию обратной частоты документов, которая считает, сколько раз термин встречается в документе, чтобы определить его важность; она также лежит в основе работы современных поисковых машин. В 1980-х годах она приступила к работе над ранними системами распознавания речи.

Джонс и ее муж Нидхем построили дом в Котоне, недалеко от Кембриджа. Он был забит книгами и произведениями искусства. В той же деревне они построили второй дом, где хранили не поместившиеся в первый книги и картины. Парусный спорт был еще одной их страстью. Пара решила не иметь детей.

«Они выбрали интеллектуальную жизнь. Они были влюблены в друг друга все время», – вспоминает друг Джонс и информатик Эндрю Херберт.

В 1982 году британское правительство привлекло Джонс для участия в Программе Алви, поддерживающей новые исследования в области информатики по всей стране. В 1993 году вместе с Джулией Р. Галлиерс они написали учебник «Оценка систем обработки естественного языка».

Через год она стала президентом Ассоциации вычислительной лингвистики. В 1999 году ее пригласили на должность профессора в Кембридже.

Фото: The New York Times

Карен Спарк Джонс умерла от рака 4 апреля 2007 года в городе Уиллингеме графства Кембриджшир. По сей день исследователи ссылаются на ее формулы. Идеи, о которых она писала в то время, сейчас активно используются для развития ИИ.

Она стала наставником для нового поколения ученых – мужчин и женщин – и придумала слоган: «Информатика слишком важна, чтобы оставлять ее только мужчинам».

Джонс опережала время и в другом в смысле. Задолго до появления Кремниевой долины она побуждала программистов думать о своем влиянии на общество.

«Существует связь между контекстом и самой задачей. Вам не нужно каждый раз задаваться философскими вопросами, когда вы прикасаетесь к клавиатуре, но поскольку компьютеры так глубоко интегрировались в нашу жизнь, вы должны думать об этом», – сказала она.

Источник. 


Материалы по теме:

Дональд Кнут – Йода Кремниевой долины

50 лет назад «Мать всех демонстраций» Дугласа Энгельбарта навсегда изменила технологии

10 уроков из жизни основоположника теории информации

Алан Тьюринг и его влияние на искусственный интеллект

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 Кто публикует самые важные научные исследования в AI?
  2. 2 Реально смотреть на продукт и его потенциал — как в этом поможет STS
  3. 3 Российские школьники победили на международной олимпиаде по химии в Казахстане
  4. 4 Подружить физиков и биологов: как синхронизировать научную команду за 5 шагов
  5. 5 «Почему у нас получился диптех-стартап, а у вас не получится» — опыт компании, которая привлекла 500 млн рублей
FutureFood
Кто производит «альтернативную» еду
Карта