+7 (831) 262-10-70

НИЖНИЙ НОВГОРОД, УЛ. Б. ПОКРОВСКАЯ, 42Б

+7 (495) 545-46-62

МОСКВА, УЛ. НАМЁТКИНА, Д. 8, СТР. 1, ОФИС 213 (ОФИС РАБОТАЕТ ТОЛЬКО С ЮРИДИЧЕСКИМИ ЛИЦАМИ)

ПН–ПТ 09:00–18:00

Компьютерные технологии в переводческой деятельности

Сорока Екатерина Сергеевна — Магистрант, Минский государственный лингвистический университет, Минск, Беларусь

В настоящее время наблюдается стремительное развитие информационных технологий и проникновение их во все сферы жизни. В результате многие профессии приходится адаптировать к современным условиям. Профессия переводчика не стала исключением. Отсюда следует, что в современной реальности специалист, осуществляющий переводческую деятельность, должен не только овладеть переводческими компетенциями, но и обладать навыками, необходимыми для эффективной работы в условиях информационного общества.

В современном мире перевод приобретает характер индустрии, все больше отдаляясь от понятия творческого процесса. Становится невозможным представить развитие такой крупной отрасли без связи с прочими областями современного человеческого знания. Очевидно, что с помощью новых технологий задачи лингвистов и переводчиков будут решаться успешнее. Поэтому, как и любая другая отрасль, перевод нуждается в адекватных инструментах.

Переводчик работает в основном с текстовой или символьной информацией. Поэтому в связи с тем, что в настоящее время подобная информация генерируется и передается напрямую с помощью компьютера, основным инструментом переводчика стал именно он. Следовательно, в процессе перевода текстов различной тематики начали активно применяться компьютерные технологии, представляющие собой различные электронные инструменты, которые в значительной степени ускоряют и облегчают переводческий процесс.

Для начала можно выделить два больших класса технологий, используемых в процессе перевода:

1)     machine translation (МТ) — машинный перевод;

2)     computer-assisted (computer-aided) translation (CAT) — автоматизированный перевод.

Программы машинного перевода призваны полностью или частично заменить переводчика-человека. Наиболее известными из них являются PROMT, Google Translate, SYSTRAN, ABBYY Compreno.

В зависимости от участия человека в процессе выполнения машинного перевода можно выделить три его вида: полностью автоматизированный машинный перевод (fully-automated machine translation), машинный перевод, выполняемый при участии человека (human-assisted machine translation), и перевод, осуществляемый человеком с использованием компьютера (machine-assisted human translation) [2]. Полностью автоматизированный машинный перевод включает ввод текста на компьютере на одном языке, его обработку компьютером и создание того же текста на другом языке. Машинный перевод, выполняемый при участии человека, предполагает редактирование текста до и после его обработки на компьютере. Перевод, осуществляемый человеком с использованием компьютера, используется для упрощения процесса перевода, в центре которого находится переводчик-человек, а компьютерная программа рассматривается лишь в качестве вспомогательного инструмента, который делает процесс перевода более эффективным, а сам перевод — более точным.

Говоря о подходах к машинному переводу, принято выделять следующие.

1.     Rule-based machine translation (RBMT) — машинный перевод на основе правил. Такой подход также принято называть «классическим». Он основан на лингвистической информации об исходном и переводном языках, а именно использует подробный двуязычный словарь и закономерности грамматик языков.

2.     Statistical machine translation (SMT) — статистический машинный перевод. В основе лежат статистические модели, параметры которых являются производными от сопоставления или сравнения двуязычных корпусов текстов, лингвистические алгоритмы при этом не используются.

3.     Example-based machine translation (EBMT) — машинный перевод на примерах. Основан на использовании сравнения параллельных текстов.

4.     Hybrid machine translation (HMT) — гибридный машинный перевод. В основе — комбинация различных подходов к машинному переводу.

В настоящее время использование машинного перевода (особенно полностью автоматизированного) не подходит для перевода, например, художественной литературы, так как без обработки текста переводчиком-человеком не всегда возможно передать заложенные в оригинал смыслы. Затруднения могут возникать в связи с наличием идиом и выражений, смысл которых невозможно передать путем пословного перевода, различием в порядке слов в предложениях (прямой или обратный, свободный или строгий), различиями, связанными с языковой картиной мира, и многими другими параметрами, затрагивающими смысл. К тому же качество машинного перевода нельзя назвать полностью удовлетворительным, так как применение таких систем не гарантирует соблюдения единства терминологии, что особенно важно в том случае, если над одним проектом работают сразу несколько переводчиков, поэтому использование подобных систем не оправдано при осуществлении работы над крупным проектом, поскольку они не дают приемлемого качества выходного текста. Однако нельзя не сказать, что в отдельных случаях использование систем машинного перевода все-таки помогает сократить затраты времени. Это происходит в том случае, если имеется текст относительно большого объема, а терминология в нем достаточно однообразна, что позволяет настроить под него систему в сравнительно небольшой срок. Тогда редактирование текста не займет слишком много времени.

В отличие от технологий первого класса (машинного перевода), системы САТ (второй класс) лишь автоматизируют и облегчают переводческую деятельность в различных ее аспектах. К ним относятся системы переводческой памяти — translation memory (TM), такие как Trados, Transit, OmegaT, DejaVu, WordFast и т. п. Основная идея подобных систем заключается в сборе и хранении уже переведенных переводчиком текстов для предоставления готовых переводов фраз или текстовых фрагментов в процессе перевода. Использование подобных программ позволяет существенно сократить время перевода, когда переводчик работает с научно-технической и деловой документацией. Однако при переводе литературных текстов использование САТ-программ скорее всего будет неоправданным.

Говоря о преимуществах использования CAT-систем, следует сказать, что при работе над большими проектами, когда задействовано сразу несколько переводчиков, САТ-программа поможет обеспечить согласованность терминологии, чего не могут сделать программы машинного перевода. Есть возможность сохранять базу переводов для ее использования при работе над новыми проектами в дальнейшем, а также существует функция совмещения технологии переводческой памяти и машинного перевода. При использовании подобных систем наблюдается повышение производительности при работе над проектом, сокращение временных и трудовых затрат, особенно при работе с документами, содержащими часто повторяющуюся информацию. К тому же САТ-программа не позволяет оставлять сегменты незаполненными, а следовательно, это гарантия того, что документ будет полностью переведен. САТ-программы позволяют работать с документами различных форматов, такими как .pdf, .xls, .docx, .rtf, .txt и другие, что, несомненно, тоже является их достоинством.

Однако можно выделить и недостатки использования САТ-систем. Например, если технология переводческой памяти ранее не использовалась, необходимо тщательно пересмотреть весь процесс перевода таким образом, чтобы «встроить» технологию в свою работу наиболее органично и эффективно. К тому же иногда переводчику сложно отследить контекст переводимого сегмента текста. В довершение всего программные оболочки в большинстве случаев несовместимы друг с другом (на данный момент не существует единого стандарта для всех САТ-программ), а сами программы имеют достаточно высокую стоимость [4].

Технологии машинного перевода (machine translation) и системы накопительного перевода (computer-assisted (computer-aided) translation) являются взаимодополняющими. Технологии первого класса готовы к использованию сразу после установки. САТ-программы же необходимо настраивать на перевод текстов определенной области и тематики, и чем больше эти тексты друг на друга похожи, тем меньше времени требуется для их настройки.

В связи с вышесказанным вполне логичным кажется наличие гибридных программ, которые основаны на сравнении параллельных текстов и объединяют системы машинного перевода и системы переводческой памяти. В качестве примера можно привести компанию PROMT, которая создала интегрированные технологии PROMT TerM и PROMT FOR TRADOS, объединяющую систему ТМ TRADOS и систему машинного перевода PROMТ XT Professional.

Несмотря на то что при работе с системами машинного перевода необходимо довольно много времени уделять предварительной обработке и подготовке текста, применение таких технологий все же позволяет сделать процесс перевода больших объемов текста более управляемым и эффективным.

С появлением и быстрым распространением всемирной информационной сети стало необходимым введение в промышленных масштабах оперативного (online) переводческого инструмента для применения в различных информационных технологиях. Только машинный перевод отвечал требованиям интернета, и это обстоятельство привело к необходимости новых разработок. Многие системы получили коммерческое развитие, что позволило им впоследствии выйти на рынок информационных технологий в качестве законченного программного продукта [1].

На этапе создания и первоначального развития интернет был почти полностью англоязычным. Однако по мере того как узкопрофессиональная сеть становилась всемирной информационной сетью, количество ее языков быстро приблизилось к количеству языков в мире. В результате растущего спроса на перевод больших объемов информации на различные языки многие владельцы самых крупных и популярных сайтов начали массовое внедрение машинного перевода. Для этого были выбраны технологии, которые позволяют осуществлять перевод в режиме реального времени. Подобные системы в основном используются на сайтах, связанных с интенсивным обменом информацией в соответствующих сферах международной деятельности. Но главное современное достижение состоит в том, что распространенные поисковые интернет-системы оснащены инструментами машинного перевода в реальном времени [3].

В целом можно сказать, что интеграция интернета и систем машинного перевода идет по двум направлениям:

1)     веб-серверы встраивают онлайн-переводчики в свои сервисы;

2)     разработчики систем машинного перевода встраивают в свои продукты средства для извлечения справочной информации [1].

В некоторой степени сократить время, затрачиваемое на осуществление перевода, позволяют программы распознавания голоса и текста.

Программы распознавания речи можно использовать для подготовки стенограмм аудиозаписей на иностранном языке, которые необходимо будет перевести в последующем, а также для диктовки переведенного текста. Обычно инструменты распознавания речи подразделяют на две группы. В первую группу входят автономные программы для персональных компьютеров и мобильных устройств. Это классические инструменты, ориентированные в первую очередь на диктовку. Иначе говоря, большая часть подобных программ предназначена для преобразования голоса конкретного человека в текст или команды. Следовательно, для повышения качества распознавания речи их нужно обучать на конкретных примерах, что, конечно, не способствует повышению качества распознавания речи в общем случае (например, при работе с аудиозаписями и видео), так как людей много и их речь очень разная. То есть можно сказать, что применение программ распознавания голоса в данном случае ограничивается необходимостью их длительного обучения. Вторая группа состоит из различных интернет-сервисов, которых становится все больше с течением времени. Стоит также отметить, что при использовании подобных средств качество и эффективность распознавания речи во многом зависят от дикции, темпа речи, оборудования и его расположения, быстродействия компьютера, наличия фоновых шумов и взаимодействия с программами автоматизации перевода. В качестве примеров подобного программного обеспечения можно привести следующие программы: Dragon Professional, Google Now, Siri, Cortana, Voice Finger.

Программы распознавания текста получили наибольшее распространение среди переводчиков, так как они существенно облегчают процесс перевода при необходимости ввода большого количества цифровых данных. Программа сканирует изображение в любом растровом формате (.jpg, .bmp или .pdf) и преобразует его в текстовый файл в формате .docx или в любой другой формат, который необходим переводчику. Как и в случае с программами распознавания речи, качество распознавания текста зависит не только от самого программного обеспечения, но и от качества вводимой информации (качество самого документа или изображения). Примерами программ распознавания текста являются ABBYY Fine Reader, CuneiForm, Adobe Acrobat Pro и другие.

Приведенные данные наглядно демонстрируют, что в настоящее время основным инструментом переводчика стал компьютер. В статье мы выяснили, что технологии, используемые в переводческой деятельности, принято делить на два класса: системы машинного перевода и системы переводческой памяти (CAT). Оба класса имеют ряд преимуществ и недостатков, но использование компьютерных технологий при осуществлении переводческой деятельности в значительной степени облегчает процесс и сокращает время, затрачиваемое на него.

Библиографический список

1.       Блинкова Л. М., Спиридонов Г. А. Актуальные проблемы гуманитарного образования: Материалы VII Международной научно-практической конференции, Минск, 22–23 октября 2020 г. / Белорусский государственный университет; редкол.: С. А. Важник (гл. ред.) [и др.]. Минск: БГУ, 2020. С. 294–301.

2.       Всеволодова А. В. Компьютерная обработка лингвистических данных: Учебное пособие для студентов, аспирантов, преподавателей-филологов. 2-е изд., испр. М.: Флинта: Наука, 2007. 96 с.

3.       Зубов А. В, Зубова И. И. Основы искусственного интеллекта для лингвистов. М.: Лoгос, 2007. 319 с.

4.       Соловьева А. В. Профессиональный перевод с помощью компьютера СПб: Питер, 2008. 160 с.