Автоматизированные системы управления на производстве.
Кулубеков М.Т.
к.э.н.. директор НОЦ
«EID»
Нурканов А.С. - магистрант
Инновационный
Евразийский университет
Перевод восточных языков
Комплекс ЯРАП ориентирован на задачи
автоматической обработки текстов - прежде всего это задачи автоматического
перевода применительно к письменной форме японского языка. Он начал создаваться
1989 году и стал первой в мире экспериментальной разработкой средств машинного
перевода для пары языков «японский- русский». Комплекс ЯРАП моделирует
классическое представление о переводе как сочетании трех различных видов
языковой деятельности: анализ - межъязыковые операции - синтез. Центральное
положение занимают здесь межъязыковые операции, которые обеспечивают переход от
языка оригинала к языку перевода и отвечают за нейтрализацию различий между
ними.
Для японского и русского языков в качестве важнейших проявлений этих различий в пределах лексико-морфологического, морфолого-синтаксического и лексико-синтаксического уровней обычно отмечают:
1.
Несовпадение позиционных
характеристик японских и русских единиц при наличии между ними достаточно
четких переводческих соотношений, позволяющих рассматривать эти характеристики
как самостоятельные единицы перевода, которым могут сопоставляться собственные
переводные соответствия [1, 7].
2.
Различие лексико-грамматических
характеристик японских и русских единиц, проявляющееся, среди прочего, в
неполном совпадении областей употребления в двух языках единиц одних и тех же
частей речи.
3.
Несовпадение лексических
особенностей языков, в том числе различие характерных для них типов омонимии и
полисемии, диктующее необходимость определения единиц перевода прежде всего в
плане языковых значимостей (собственно знаковом плане языка) [2, 37], а также
расхождения между японской и русской лексикой в объеме понятий, выражаемых
отдельными лексемами, и в степени аналитичности языковых номинаций.
Комплекс состоит из трех основных подсистем: подсистемы
анализа входного японского текста JapAn (JapaneseAnalysis), подсистемы японско-
русских межъязыковых операций
JaRus (Japanese-Russiantransfer) и подсистемы синтеза русского текста RUMORS
(RUssianMOR phologyandSyntax). В качестве теоретико-лингвистического фундамента
для разработки всех трех подсистем комплекса принят сущностный подход к языку и
его формализованному лингвистическому описанию [3, 58]. К настоящему времени
построена лексико-морфологическая версия комплекса ЯРАП, охватывающая пока
низшие лингвистические уровни обоих рассматриваемых языков, от графического до
морфолого-синтаксического.
Подсистема японско-русских межъязыковых операций JaRus
обеспечивает переход от языка оригинала (японского) к языку перевода (русскому)
и отвечает за нейтрализацию важнейших различий между языками. Для этого она объединяет
в себе два основных компонента: блок предпереводческого анализа и блок
собственно переводах.
Основными функциями блока пред переводческого анализа
являются:
-
выделение позиционных
единиц перевода как
таких
последовательностей слов или словосочетаний, внутри которых все позиционные отношения между их непосредственными компонентами должны обрабатываться однородным образом, т.е. либо сохраняться, либо инвертироваться;
- осуществление контекстуальной коррекции переводных эквивалентов для входных японских единиц в случаях несовпадения набора допустимых для них синтаксических функций с соответствующими свойствами их основных русских эквивалентов;
-
выявление фразеологических единиц, а
также других словосочетаний, требующих нестандартного перевода для всех или
некоторых своих компонентов, и внесение изменений в переводные эквиваленты
соответствующих компонентов;
-
установление отдельных
лексико-синтаксических связей - с той степенью надежности, с которой это
возможно без выявления полной синтаксической структуры предложения.
После завершения пред переводческого анализа его результаты
обрабатываются блоком перевода, который преобразует их в русское
морфолого-синтаксическое представление, передаваемое далее подсистеме русского
синтеза. Блок перевода может в принципе работать и без пред переводческого
анализа. Результатом будет по сегментный перевод входного японского текста -
его «прямой» подстрочник, элементы которого остаются в том же порядке, что и
исходные японские морфологические элементы. Комплекс ЯРАП функционирует при
этом как японско-русский автоматический словарь, работающий с учетом
морфологического и морфолого-синтаксического контекста. Подсистема русского
синтеза RUMORS завершает процесс перевода, строя выходной русский текст по тому
его представлению, которое поступило на ее вход. Важным свойством этой
подсистемы является то, что она может работать с «недоопределенными» и
«переопределенными» входными данными, восполняя и корректируя на этапе синтеза
информацию, которая могла оказаться в них отсутствующей или неточной. После
того, как входное представление скорректировано, осуществляется синтез,
отвечающей ему окончательной цепочки словоформ, которая и выдается в качестве
результата перевода.
Литература
1 Папкова Л.А., Петровский A.M., Шнейдерман М.В. Организация экспертиз и анализ экспертной информации. - М.: Наука, 1984. - 120 с.
2
Первое Всесоюзное совещание по статистическому и дискретному
анализу нечисловой информации, экспертным оценкам и дискретной оптимизации.
//Тезисы докладов ВИНИТИ. - М.: ВИНИТИ, 1981. - 439 с.
3
Пиотровский Р.Г. Бектаев К.Б. и др.
Математическая лингвистика. - М. Высшая школа., 1977. - 324 с.