Принципы Джорджтаунского эксперимента



Джорджтаунский эксперимент — это демонстрация машинного перевода, которая была проведена 7 января 1954 года и оказала большое влияние на развитие машинного перевода во всем мире. Разработанный совместно с Джорджтаунским университетом и компанией IBM, эксперимент включал полностью автоматический перевод более шестидесяти предложений с русского языка на английский.

Предпосылки

Эксперимент был задуман и подготовлен с целью привлечения общественного и правительственного внимания к возможностям и перспективам машинного перевода. Стоит отметить, однако, что демонстрируемая в эксперименте система не являлась полноценной: в ее словаре было всего 6 грамматических правил и 250 лексических единиц (корней и флексий). Полностью данный словарь продемонстрирован не был. Помимо общих тем, система специализировалась в области органической химии, а также был добавлен ряд предложений общей тематики. Перевод осуществлялся на мейнфрейме IBM 701 (запущена в апреле 1953 года). Предложения должны были быть напечатаны на карточках. В компьютер в торжественной обстановке на перфокартах вводились предложения вроде: «Обработка повышает качество нефти», «Командир получает сведения по телеграфу», — и машина выводила их перевод, напечатанный при помощи транслитерации. Эксперимент Джорджтаунского эксперимента и IBM является наиболее известным результатом конференции MIT, проведенной в июне 1952 года, на которую были приглашены все активные исследователи в области машинного перевода. На конференции Дункан Харкин из Министерства обороны США предложил, чтобы его ведомство финансировало новый проект машинного перевода. Джером Вайснер поддержал эту идею и предложил финансирование из Исследовательской лаборатории электроники Массачусетского технологического института. Леон Достер был приглашен в проект в связи с наличием большого опыта работы с автоматической коррекцией переводов (тогда еще «механический перевод»); его система интерпретации оказала сильное влияние на Нюрнбергский процесс. Лингвистическая часть демонстрации проводилась по большей части лингвистом Полом Гарвином, который также хорошо знал русский язык.

Ход эксперимента

В целом, руководили экспериментом профессор Джорджтаунского университета Леон Достер и глава прикладных разработок компании IBM Катберт Хёрд. За непосредственное проведение эксперимента отвечали: адъюнкт-профессор Джорджтаунского университета Пол Гарвин — за лингвистическую часть, и сотрудник IBM Питер Шеридан — за компьютерную часть. Демонстрация была широко освещена в СМИ и воспринята как успех. Она повлияла на решение правительств некоторых государств, в первую очередь США, направить инвестиции в область вычислительной лингвистики. Более 60 латинизированных русских выражений из широкого круга политических, юридических, математических и научных тем были введены в машину оператором компьютера, который не знал русского языка, и полученные английские переводы появились на принтере. Предложения для перевода были тщательно отобраны. Многие операции для демонстрации были приспособлены к конкретным словам и предложениям. Кроме того, не было никакого реляционного анализа или анализа предложений, который мог бы распознать структуру предложения. Подход был в основном «лексикографическим», основанным на словаре, где конкретное слово имело связь с конкретными правилами и шагами.

6 шагов

Операция 0 — существует точный эквивалент переведенного элемента. Необходимы дальнейшие шаги.

Операция 1 — перестановка положения слов по модели AB > BA

Операция 2 — Проблема выбора между несколькими вариантами. Результат основан на порядке слов (максимум три слова).

Операция 3 — Также проблема выбора между несколькими вариантами. Но результат зависит от предыдущих слов (максимум трех).

Операция 4 — Пропуски лексического (морфологического) элемента. Исходный элемент в языке оригинала был лишним.

Операция 5 — Вставка лексического (морфологического) элемента. Элемент отсутствует на языке перевода.

Примеры перевода

Русский язык (латиница)

Mi pyeryedayem mislyi posryedstvom ryechyi.

Vyelyichyina ugla opryedyelyayetsya otnoshyenyiyem dlyini dugi k radyiusu.

Myezhdunarodnoye ponyimanyiye yavlyayetsya vazhnim faktorom v ryeshyenyiyi polyityichyeskix voprosov.

Английский язык

We transmit thoughts by means of speech.

Magnitude of angle is determined by the relation of length of arc to radius.

International understanding constitutes an important factor in decision of political questions.

Последствия эксперимента

Хорошо освещенный журналистами и воспринимаемый как успех, эксперимент действительно побудил правительства инвестировать в компьютерную лингвистику. Авторы утверждали, что в течение трех-пяти лет машинный перевод вполне может быть широко распространен. Однако реальный прогресс был гораздо медленнее, и после доклада ALPAC в 1966 году, который показал, что десять лет длительных исследований не оправдали ожиданий, финансирование было резко сокращено. Джорджтаунский эксперимент получил широкое освещение в иностранной прессе, но лишь небольшая часть журналистов обратила внимание на предыдущие попытки осуществления машинного перевода.