+7 (831) 262-10-70

+7 (831) 280-82-09

+7 (831) 280-82-93

+7 (495) 545-46-62

НИЖНИЙ НОВГОРОД, УЛ. Б. ПОКРОВСКАЯ, 42Б

ПН–ПТ 09:00–18:00

Типы неоднозначности языковых выражений в машинном переводе

Типы неоднозначности языковых выражений в машинном переводе

Автор: Уткина Надежда Вениаминовна, кандидат философских наук, старший преподаватель кафедры иностранных языков неязыковых специальностей Вятского государственного гуманитарного университета, г. Киров
Статья подготовлена для публикации в сборнике «Актуальные вопросы переводоведения и практики перевода».

 

В машинном переводе отличают решение неоднозначности в исходном языке от решения неоднозначности в выходном языке. Соответственно процесс перевода подразделяется на анализ и трансфер. Естественного раздела между решением неоднозначности в исходном языке и в переводе не существует. Данное явление представляет собой скорее прагматическую границу, следующую из разделения труда между анализом и трансфером. Следует признать, что несколько возможных переводов лексемы не обязательно доказывают соответствующую двусмысленность этой лексемы в исходном языке. Проблема здесь в том, что одна и та же информация может быть передана совершенно по-разному в других языках. Например, при переводе немецкого предложения «Er schwimmt im Pool» на английский язык «Hе/It is floating/swimming in the pool» необходимо определить, плывет ли исполнитель действия (т.е. активно работает руками) или только лежит на поверхности. В немецком языке нет необходимости выражать данную разницу. Хотя глагол «schwimmen» можно перевести на английский язык двумя способами, но они не являются неоднозначными в немецком языке. Традиционно различают структурную, референциальную и лексическую неоднозначности.

Структурная неоднозначность. Из-за (полу-) свободного порядка слов в немецком языке, существует две возможных синтаксических структуры предложения «Die Hersteller produzieren Schaltkreise» (английский вариант
The manufactories produce integrated circuits), где «Hersteller» – субъект, а «Schaltkreise» – объект и наоборот. Оптимальный вариант немецкие лингвисты Б. Шмитц и Й. Квантц определяют выдвижением двух предположений: 1) при отсутствии дополнительной информации в предложении предполагается немаркированный вид порядка слов, где акцент делается на субъекте; 2) исполнитель действия обычно более «живой» чем тот, на кого направлено действие; для большинства активных глаголов исполнитель действия является субъектом. Данные предположения могут быть рассмотрены как правила с исключениями (исключение к первому правилу выражено примером «Schaltkreise produzieren die Hersteller», исключение ко второму правилу – немецкое предложение «Diktaturen produzieren Konformisten» или английское предложение «This sort of environment produces criminal types»). В предложении «Die Hersteller produzieren Schaltkreise» оба предположения за трактовку «Hersteller» как субъекта и «Schaltkreise» как объекта. Однако в предложении «Schaltkreise produzieren die Hersteller» объект топикализирован, данное явление в английском языке может быть выражено посредством пассивизации («Circuits are produced by the manufactures»). Таким образом, предположения противоречат друг другу, так как в соответствии с первым предположением субъект – «Schalkreise», а в соответствии с другим – «Hersteller» [4; с. 5–6].

Лексическая неоднозначность. Согласно своему семантическому типу лингвистическое выражение может быть категоризировано (обычно на основе типовой иерархии). Семантические типы используются, чтобы кодировать ограничения сочетаемости. Ограничения сочетаемости – средство для выражения семантического согласия между функтором и его аргументами. Так, например глагол «die», может быть использован только к тем предметам, которые были когда-то живыми, т. е. субъект действия «die» должен быть «живым». Однако метафоры употребляются также и в технических докладах, например, «The program died before it reached this routine». «The bill will probably die in the senate». «The movement died in the late thirties» [4; с. 6].

Существует две общих возможности сформулировать ограничение сочетаемости для «die»: 1) агенс «die» должен быть объектом, который может подвергнуться перемене состояния; данное правило применимо к широкому диапазону случаев и поэтому его эффект решения неоднозначности слаб;
2) агенс «die» должен быть живым объектом; существуют дополнительные правила, которые необходимы для выражения метонимического расширения.

Другим примером выступают предлоги, которые могут использоваться как предлоги времени, так и как предлоги места («in the seventies», «in the pocket»). Анализ решает, какая трактовка таких предлогов выражена во входной фразе. Семантический тип основного существительного предложной фразы может предоставить необходимую информацию в большинстве случаев, однако очевидно, семантический тип не может быть рассмотрен как точная информация. Всегда возможен сдвиг типа, если этого требует контекст как в предложении «After Jalta the world looked different».

Такие виды сдвигов типа встречаются не только в поэтическом языке. Скорее всего, мы наблюдаем семантический сдвиг типа (как неоднозначность в целом) как универсальное средство для обеспечения эффективности языка. В литературе упоминаются разнообразные изменения семантического типа. Во-первых, существуют такие случаи как: «John’s dissertation, which weighs five pounds, has already been refuted» и «Plato, who is on the top shelf, was a great author».Семантика лексем «dissertation» и «Platon» содержит различные аспекты. «Dissertation» может рассматриваться и как физический объект и как его содержимое. Слово «Platon» можно принять за автора или за его труд.

Другой случай, описанный как своего рода сдвиг типа, продемонстрирован в предложении «The mushroom omelet left without paying» [4; с. 24]. По сравнению с прежними примерами контекст здесь намного важнее. В дополнительном контексте практически любое выражение может cоотноситься с любым референтом. Основные принципы исследованы французским лингвистом Ж. Фоконнье, который использовал понятие  Г. Нюнберга о прагматической функции [1; 2]. Прагматическая функция соединяет два домена таким образом, что описание элемента первого домена можно использовать для определения элемента второго домена. Необходимо изучить, какой вид информации – либо контекст либо фоновое знание – способствует поиску оптимального варианта. В примере «The mushroom omelet left without paying» глагольная фраза «left without paying» обычно требует в качестве исполнителя действия человека, что естественно приводит к интерпретации «mushroom omelette» как агенса-человека.

Другим весьма многообещающим подходом в решении проблемы сдвига семантического типа является предложение Дж. Пустейовского об изменении типа (type coercion). Ученый рассматривает лексемы как полиморфные функции и вводит понятие изменение типа. В дополнение к этому он заявляет, что смысловая структура одного объекта (qualia structure) состоит из четырех полей: 1) отношение между объектом и его составляющими; 2) отношение, которое выделяет его в предметной области; 3) назначение объекта (цель и функция объекта); 4) причины, приведшие к появлению данного объекта [3].

Посредством изменения типа вместе с qualia structure Дж. Пустейовский может объяснить, почему предложение «Mary enjoyed the book» обычно интерпретируется как «Mary enjoyed reading the book». Лексический трансфер обычно касается устранения двусмысленности, т.к. большинство лексем дают начало более чем одному переводу. В предложениях «He lived in a big apartment» и «He lived in the fifteenth century» выражение «he lived» в обоих предложения может быть переведено на немецкий язык как «er lebte», но в первом случае перевод «er wohnte» является наиболее естественным. Перевод «er wohnte» не возможен во втором случае.

Референциальная неоднозначность. Любая номинация и любое описание денотативной ситуации в тексте могут быть признаны адресатом неполными в силу того, что они не отражают каких-либо признаков, присущих денотату. В случае, если некоторая номинация может быть отнесена к любому из множества эквивалентных объектов реального мира, мы будем говорить о референциальной неоднозначности. Таким образом, референциальная неоднозначность понимается как невозможность для адресата однозначно указать денотат из-за неполноты признаков в тексте. Например, «In its analysis of the shortcoming of Europe’s research potential, the Commission identified large gaps in the research continuum between universities on the one hand regarding work as too applied and industry on the other hand regarding it as too basic» [4; с. 7]. В данном предложении все именные группы в единственном числе (кроме «analysis») являются возможными антецедентами для «its» и «it».

Таким образом, одна из задач анализа – установление интер- и интра-сентенциальных анафорических связей – может быть реализована только с помощью разнообразной информации. Важное значение имеют следующие факторы: а) морфологические (согласование в лице, числе и роде);
б) синтаксические (позициональная и синтаксическая функция выражений в предложении); в) семантические (какая тематическая роль осуществляется референтом); г) тематические (что является тематичеcким в предложении, в тексте); д) факторы, касающиеся содержания (что было уже сказано о референте); ж) лексические (ограничения, смысловые отношения);
з) энциклопедические (какие утверждения совместимы друг с другом на основе фонового знания).

Комбинация различных видов неоднозначности. В предложении может присутствовать сразу несколько видов двусмысленностей. Например, у выражения «its achievement» в предложении «Mounting a “technology push” across the Community capable of achieving technical parity with, if not superiority over, our main competitors within the next ten years represents an ambitious objective that will require for its achievement a joint effort» переплетаются: референциальная двусмысленность (притяжательное местоимение «its» может быть анафорически связано со всеми именными группами в единственном числе, кроме «achievement», которое исключено обязательными принципами); лексическая двусмысленность («achievement» имеет, по крайней мере, две трактовки:
1) «action of achieving»; 2) «a thing done successfully»; структурная двусмысленность (в выражении «its achievement» местоимение может быть исполнителем действия и того, на кого направлено действие) [4; с. 11].

Таким образом, решение неоднозначности осуществляется на синтаксическом, семантическом и концептуальном уровнях.

 

СПИСОК ЛИТЕРАТУРЫ

1.      Fauconnier, G. Mental spaces: aspects of meaning construction in natural language [Тext] / G. Fauconnier. Cambridge, Ma.: Bradford. 1985. – 187 p.

2.      Nunberg, G. The Pragmatics of Reference Bloomington [Тext] /
 G. Nunberg. Indiana: Indiana University Linguistics Club. 1978. – 210 p.

3.      Pustojevsky, J. Semantics and the lexicon [Теxt] / J. Pustojevsky. Netherlands: Springer. 1993. – 428 p.

4.      Schmitz, B. Defaults in machine translation [Теxt] / B. Schmitz,
J. Quantz. – Berlin. 1993. – 31. S.