Мячин Дмитрий
Алексеевич
Оренбургский
Государственный Университет, студент 1 курса группы 15Л(ба)-4(ф)
Научный
руководитель: Переходько Ирина Валериевна, к.п.н., доцент.
Лингвистические
особенности постредактирования машинного перевода Web-сайтов
В современном мире большое значение
имеют интернет-коммуникации. Интернет предоставляет нам доступ к огромному
количеству информации, большая часть которой представлена зарубежными
источниками. Одними из главных причин непонимания иностранных сайтов является
незнание потребителем языков, а также отсутствие у носителя информации о данном
продукте на языке потребителя. В решении этой проблемы могут помочь электронные
переводчики.
История электронных переводчиков берет
свое начало в 40х годах XX
века. Впервые концепция машинного перевода была сформулирована Уорреном
Уивером, директором отделения естественных наук Рокфеллерского Фонда, в его
меморандуме, адресованному Фонду, в 1949.
В 1954, в рамках Джорджтаунского эксперимента,
был проведен первый машинный перевод с русского языка на английский. После
этого машинный перевод стал активно развиваться, но достичь адекватного и
эквивалентного результата не представлялось возможным. В 1967 году в отчете
наблюдательного комитета по автоматической обработке текстов национальной
академии наук США по целесообразности была подчеркнута непригодность машинного
перевода без последующей обработки. [1]
С 1968 года до настоящего времени
машинный перевод используется для выполнения рутинных задач переводчика.
Машинный перевод — процесс перевода
текстов с одного естественного языка на другой, посредством систем машинного
перевода.
В
настоящее время вопрос машинного перевода без последующего редактирования не
ставится, так как программное обеспечение не дает возможности для подбора адекватного
эквивалента некоторым семантическим конструкциям.
Макото
Нагао, профессор университета Киото, в своем докладе в 1982 году сделал
следующее заявление, подтверждающее неспособность электронного переводчика
заменить человека: «Всякая разработка систем машинного перевода рано или поздно
зайдет в тупик. Наша разработка также зайдет в тупик, но мы постараемся, чтобы
это случилось как можно позже». [3]
Профессор
Макото Нагао предложил осуществлять машинный перевод текстов по аналогии с
другими текстами, переведенными ранее вручную. При этом он предполагал, что
может быть сформирован и загружен в мощную многопроцессорную ЭВМ достаточно
большой массив текстов на одном языке и их переводов на другой язык (массив
билингв) и, опираясь на этот массив, можно будет осуществлять перевод новых
текстов. [2]
В
практической части нашего исследования, мы предприняли сравнительный анализ оригинального
сайта французского интернет провайдера «Orange» и этого же сайта, переведенного
электронным переводчиком google
translate.
«Orange» - это крупнейшая французская
телекоммуникационная компания, которая является оператором сотовой связи и
интернет провайдером в 32 станах мира, среди которых: Франция, Бельгия, Испания
и Швейцария.
На
сайте этой компании находится множество материалов, связанных с
интернет-коммуникациями, компьютерный перевод которых затруднен по причине
наличия специализированной лексики.
При
машинном переводе одной из статей данного сайта, посвящённой нами были выделены
следующие ошибки:
Название статьи звучит как: «Sécuriser sa box, Quelques petits trucs à savoir». [4]
Электронный переводчик переводит это предложение, как «Безопасный ящик.
Некоторые советы, чтобы знать», что является ошибкой семантического характера,
так как слово «box»
здесь имеет значение «роутер», а слово «Sécuriser» - это глагол, одно из
значений которого – «обеспечивать безопасность», то есть такое словосочетание,
по нашему мнению, может переводиться, как «Несколько небольших советов по
обеспечению безопасности вашего роутера».
Приведем
еще один пример: «Petit rappel des bons principes à connaître» [4]
- «Малый напоминание о хороших принципов знать», электронный переводчик не
способен дать эквивалент этой фразе и предлагает подстрочный перевод,
постпереводчик же может перевести фразу как: «Небольшое напоминание о полезных
принципах, которые следует знать».
Другой
пример, подтверждающий нашу точку зрения: «Un orage, la foudre
qui
tombe
pas
loin
de
chez
vous
et
votre
box
pourrait
se
retrouver
hors
service»
[4] также относится к категории семантических ошибок электронный перевод звучит
как: «Гроза, молния не выйди из дома и ваш ящик может обрываться». Проведя
постредактирование, мы предлагает такой вариант перевода: «Гроза, молния,
проходящие около вас и вашего роутера могут сделать его нерабочим».
Приведем
следующий пример: «Cette précaution vaut aussi pour le décodeur
TV» [4] - «Это предостережение относится также к телевизору декодера». Данная ошибка связана с использованием специализированной
лексики. Здесь речь идет о ТВ декодере – это устройство для просмотра ip-телевидения. В силу недостатка у
программы
Проблемы
грамматических ошибок практически решены, но тем не менее электронные
переводчики их иногда допускают. Подтверждением этого может служить лексико-грамматические
ошибки в электронном переводе первого предложения из данной статьи: «Rentrer chez soi, allumer son ordinateur
et
se
connecter
à Internet
est
devenu
un
automatism» [4] - «Иди домой, включите свой
компьютер и подключение к Интернету стало автоматическим». Смысл
фразы ясен, но грамматически она переведена неверно – большая часть слов стоит
в переводе в неверной форме. То есть слова «rentrer», «allumer», «se connecter» - это инфинитивы
глаголов «возвращаться», «включать» и «подключаться», а слово «un automatism» - это существительное «автоматизм». То
есть фраза может, по нашему мнению, переводиться как: «Прийти домой, включить
компьютер, подключиться к интернету стало автоматическими действиями».
Довольно
объемную группу ошибок электронного перевода составляют синтаксические ошибки.
Например, «Pour
éviter
ces
désagréments, il est
donc
fortement
conseillé
de
paramétrer votre box» [4] - «Чтобы избежать этого, крайне
желательно, чтобы установить флажок». В данном предложении допущены сразу два
вида ошибок: семантическая – неверный перевод, и синтаксическая – ненужное
употребление предлога «чтобы». После постредактирования это предложение
выглядело бы так: «Чтобы избежать этой неприятности, настоятельно рекомендуется
выставить соответствующие параметры вашего роутера».
Приведем
еще один пример: «Ce
nouveau
mot
de
passe
peut
être
composé
de
chiffres,
de
minuscules,
de
majuscules
et
d’un ou deux signes de type dièse ou tiret» [4] - «Новый пароль может состоять
только из цифр, букв и один или два типа знаков фунт или тире» - в этом переводе
неверно употреблены формы слов и правильный перевод мог бы звучать так: «Новый
пароль может состоять только из цифр, букв и одного или двух знаков типа шарп
или тире».
Результаты
проведенного нами анализа позволяют сделать вывод о том, что электронные переводчики
допускают многочисленные ошибки при переводе текстов. Ошибки бывают разных
видов и как показало наше исследование наименьшее число ошибок составляют
грамматические, наибольшая же их часть – это семантические ошибки. Также
увеличивает число семантических ошибок наличие в тексте специализированной
лексики, понимание смысла которой невозможно без дополнительных знаний,
которыми электронные переводчики практически не обладают. В будущем, возможно,
когда будет еще более развит искусственный интеллект компьютерные переводчики
смогут выдавать более адекватный и эквивалентный перевод сайтов.
Список
литературы
1. Компьютерная
лингвистика в системе научно-технической информации. / Под ред. проф. Г.Г.
Белоногова. // Вопросы информационной теории и практики. М.: ВИНИТИ, 1989. - №
58.
2. Nagao M. A framework of a mechanical translation
between Japanese and English by analogy principle, in Artificial and Human
Intelligence, ed. A. Elithorn and R. Banerji. North Holland, 1984.
3. Хорошилов
А.А. Теоретические основы и методы построения систем фразеологического
машинного перевода: автореф. дис. ... канд./д-ра технических наук, Москва,
2006.
4. Интернет
провайдер Orange
[Электронный ресурс]: http://www.orange.com/fr/accueil