Мячин Дмитрий Алексеевич

Оренбургский Государственный Университет, студент 1 курса группы 15Л(ба)-4(ф)

Научный руководитель: Переходько Ирина Валериевна, к.п.н., доцент.

Лингвистические особенности постредактирования машинного перевода Web-сайтов

         В современном мире большое значение имеют интернет-коммуникации. Интернет предоставляет нам доступ к огромному количеству информации, большая часть которой представлена зарубежными источниками. Одними из главных причин непонимания иностранных сайтов является незнание потребителем языков, а также отсутствие у носителя информации о данном продукте на языке потребителя. В решении этой проблемы могут помочь электронные переводчики.

         История электронных переводчиков берет свое начало в 40х годах XX века. Впервые концепция машинного перевода была сформулирована Уорреном Уивером, директором отделения естественных наук Рокфеллерского Фонда, в его меморандуме, адресованному Фонду, в 1949.

         В 1954, в рамках Джорджтаунского эксперимента, был проведен первый машинный перевод с русского языка на английский. После этого машинный перевод стал активно развиваться, но достичь адекватного и эквивалентного результата не представлялось возможным. В 1967 году в отчете наблюдательного комитета по автоматической обработке текстов национальной академии наук США по целесообразности была подчеркнута непригодность машинного перевода без последующей обработки. [1]

         С 1968 года до настоящего времени машинный перевод используется для выполнения рутинных задач переводчика.

         Машинный перевод — процесс перевода текстов с одного естественного языка на другой, посредством систем машинного перевода.

В настоящее время вопрос машинного перевода без последующего редактирования не ставится, так как программное обеспечение не дает возможности для подбора адекватного эквивалента некоторым семантическим конструкциям.

Макото Нагао, профессор университета Киото, в своем докладе в 1982 году сделал следующее заявление, подтверждающее неспособность электронного переводчика заменить человека: «Всякая разработка систем машинного перевода рано или поздно зайдет в тупик. Наша разработка также зайдет в тупик, но мы постараемся, чтобы это случилось как можно позже». [3]

Профессор Макото Нагао предложил осуществлять машинный перевод текстов по аналогии с другими текстами, переведенными ранее вручную. При этом он предполагал, что может быть сформирован и загружен в мощную многопроцессорную ЭВМ достаточно большой массив текстов на одном языке и их переводов на другой язык (массив билингв) и, опираясь на этот массив, можно будет осуществлять перевод новых текстов. [2]

В практической части нашего исследования, мы предприняли сравнительный анализ оригинального сайта французского интернет провайдера «Orange» и этого же сайта, переведенного электронным переводчиком google translate.

«Orange» - это крупнейшая французская телекоммуникационная компания, которая является оператором сотовой связи и интернет провайдером в 32 станах мира, среди которых: Франция, Бельгия, Испания и Швейцария.

На сайте этой компании находится множество материалов, связанных с интернет-коммуникациями, компьютерный перевод которых затруднен по причине наличия специализированной лексики.

При машинном переводе одной из статей данного сайта, посвящённой нами были выделены следующие ошибки:

Название статьи звучит как: «Sécuriser sa box, Quelques petits trucs à savoir». [4] Электронный переводчик переводит это предложение, как «Безопасный ящик. Некоторые советы, чтобы знать», что является ошибкой семантического характера, так как слово «box» здесь имеет значение «роутер», а слово «Sécuriser» - это глагол, одно из значений которого – «обеспечивать безопасность», то есть такое словосочетание, по нашему мнению, может переводиться, как «Несколько небольших советов по обеспечению безопасности вашего роутера».

Приведем еще один пример: «Petit rappel des bons principes à connaître» [4] - «Малый напоминание о хороших принципов знать», электронный переводчик не способен дать эквивалент этой фразе и предлагает подстрочный перевод, постпереводчик же может перевести фразу как: «Небольшое напоминание о полезных принципах, которые следует знать».

Другой пример, подтверждающий нашу точку зрения: «Un orage, la foudre qui tombe pas loin de chez vous et votre box pourrait se retrouver hors service» [4] также относится к категории семантических ошибок электронный перевод звучит как: «Гроза, молния не выйди из дома и ваш ящик может обрываться». Проведя постредактирование, мы предлагает такой вариант перевода: «Гроза, молния, проходящие около вас и вашего роутера могут сделать его нерабочим».

Приведем следующий пример: «Cette précaution vaut aussi pour le décodeur TV» [4] - «Это предостережение относится также к телевизору декодера».  Данная ошибка связана с использованием специализированной лексики. Здесь речь идет о ТВ декодере – это устройство для просмотра ip-телевидения. В силу недостатка у программы

Проблемы грамматических ошибок практически решены, но тем не менее электронные переводчики их иногда допускают. Подтверждением этого может служить лексико-грамматические ошибки в электронном переводе первого предложения из данной статьи: «Rentrer chez soi, allumer son ordinateur et se connecter à Internet est devenu un automatism» [4] - «Иди домой, включите свой ​​компьютер и подключение к Интернету стало автоматическим». Смысл фразы ясен, но грамматически она переведена неверно – большая часть слов стоит в переводе в неверной форме. То есть слова «rentrer», «allumer», «se connecter» - это инфинитивы глаголов «возвращаться», «включать» и «подключаться», а слово «un automatism» - это существительное «автоматизм». То есть фраза может, по нашему мнению, переводиться как: «Прийти домой, включить компьютер, подключиться к интернету стало автоматическими действиями».

Довольно объемную группу ошибок электронного перевода составляют синтаксические ошибки. Например, «Pour éviter ces désagréments, il est donc fortement conseillé de paramétrer votre box» [4] - «Чтобы избежать этого, крайне желательно, чтобы установить флажок». В данном предложении допущены сразу два вида ошибок: семантическая – неверный перевод, и синтаксическая – ненужное употребление предлога «чтобы». После постредактирования это предложение выглядело бы так: «Чтобы избежать этой неприятности, настоятельно рекомендуется выставить соответствующие параметры вашего роутера».

Приведем еще один пример: «Ce nouveau mot de passe peut être composé de chiffres, de minuscules, de majuscules et dun ou deux signes de type dièse ou tiret» [4] - «Новый пароль может состоять только из цифр, букв и один или два типа знаков фунт или тире» - в этом переводе неверно употреблены формы слов и правильный перевод мог бы звучать так: «Новый пароль может состоять только из цифр, букв и одного или двух знаков типа шарп или тире».

Результаты проведенного нами анализа позволяют сделать вывод о том, что электронные переводчики допускают многочисленные ошибки при переводе текстов. Ошибки бывают разных видов и как показало наше исследование наименьшее число ошибок составляют грамматические, наибольшая же их часть – это семантические ошибки. Также увеличивает число семантических ошибок наличие в тексте специализированной лексики, понимание смысла которой невозможно без дополнительных знаний, которыми электронные переводчики практически не обладают. В будущем, возможно, когда будет еще более развит искусственный интеллект компьютерные переводчики смогут выдавать более адекватный и эквивалентный перевод сайтов.

         Список литературы

1.     Компьютерная лингвистика в системе научно-технической информации. / Под ред. проф. Г.Г. Белоногова. // Вопросы информационной теории и практики. М.: ВИНИТИ, 1989. - № 58.

2.     Nagao M. A framework of a mechanical translation between Japanese and English by analogy principle, in Artificial and Human Intelligence, ed. A. Elithorn and R. Banerji. North Holland, 1984.

3.     Хорошилов А.А. Теоретические основы и методы построения систем фразеологического машинного перевода: автореф. дис. ... канд./д-ра технических наук, Москва, 2006.

4.     Интернет провайдер Orange [Электронный ресурс]: http://www.orange.com/fr/accueil