Прикладная информатика / Информационные системы                                           

                                              Қаталбаева Қ.Қ.

ф.м.ғ.к. Иманбаев Қ.С.

  ф.м.ғ.к.Джанұзақов С.Д.

      Казахский Экономический Университет им.Т.Рыскулова,Казахстан

Аударма ісіндегі қолданылатын интеллектуалды жүйелер.

 

         Ақпараттық технологиялардың көкейкесті бағыттарының бірі - компьютерлік технологиялардың интеллектуалы жүйелер.  Ғылымның дамуы осы тұжырымның орындылығын біртіндеп нақтылап келеді.

  Тарихи даму жолы бар жасанды интеллект жүйелер қазіргі уақытта көптеген бағыттарға бөлінген: образдарды тану, көру немесе есту қасиеттеріне, медициналық диагностикаға, ауа райын болжауға, т.б. байланысты; табиғи тілді қолдану, сұрақ-жауап жүйесіне және автоматтандырылған аударма жүйесіне көңіл бөлінеді; эксперттік жүйелер, эксперт-адамның біліміне және компьютердің құрылымына сүйенген жүйе; білімнің инженериясы, білімді көрсете білу, оны қолданушыға түсінікті жеткізе білу және оны кеңейту аумағы.

Интеллектуалды жүйелер және оның бағыттарының бірі эксперттік жүйелердің жоғары оқу орындарында пән ретінде оқытылуы - мақсаты қалыптасқан күрделі есептерді автоматтандыру саласында мамандар даярлау болып табылады. Интеллектуалды жүйелер ол мәліметтер мен білімнің негізінде мақсатты талдай алатын, әрекет жайлы шешім шығара алатын, мақсатқа қол жеткізу үшін тиімді әдістер таба алатын, адам немесе автономмен біріге жұмыс атқаратын ақпараттық процессордың техникалық құралдар мен бағдарламалық қамтамасыз ету жиынтығымен бірігуі.

Соңғы онжылдықта математиканың жаңа қолданбалы аймағы жасанды нейрондық жүйе ретінде дамып келе жатыр. Жасанды нейрондық желі негізінде интеллектуалды жүйелер, бейнелерді тануды, бақылаудың орындалуын, тиімділікті, ассоциативті жады және басқарудың мәселелерін орындап келе жатыр. Нейрондық желі— өлшенген байланыс сызықтарымен жалғастырылған салыстырмалы түрде күрделі емес өндеуші элементтерден тұрады. Элементтер әсер ету мен баптауға рұқсаты бар байланыс желілерімен жалғастырылған. Ал әрбір элемент кейбір сызықтық емес функцияның кіріске түскен мәнін қолдана отырып, кейбір мәнді өндіреді және өндірілген мәнді басқа бір элементке береді немесе оны өзінің шығысына орналастырады. Нейрондық желі нерв жүйесіндегі нейрондардың қимылын модельдеу үшін қолданылады.

Компьютермен жасалынатын аударма - күрделі, үлкен ғылыми мақсат. Күрделілігі, табиғи тілдер кері формалдауға беріледі. Аудару ісінде интеллектуалды жүйелерді қолдануың түп тамыры тереңде. Оның негізі ретінде компьютермен жасалынатын аударма. Машиналы аударма мүмкіндігі туралы алғаш рет ой тастаған Чарльз Бэббидж, ол 1836-1848 жж. сандық аналитикалық машиналар жобасын әзірлеген. Ч.Бэббидж идеясы сақтау көлемі 1000 50-дәрежелі ондық сандардан тұратын сөздіктерді сақтау үшін қолдануға болады. Ч.Бэббидж бұл идеяны ағылшын үкіметі  үшін сауалды дәлелдеу құралы сапасында келтірді, аналитикалық машинаны қажетті физикалық іске асыру үшін, бірақ бұл ойы іске аспады.

Ал 100 жылдан кейін, 1947 жылы, У.Уивер Норберт Винерге хат жазды. Бұл хатта ол мәтіндердің аударма шифрын анықтау техникасы үшін қолдануды ұсынды. Осы жыл машиналы аударманың туу жылы және сөзбе-сөз алгоритмді аударманы жүзеге асыру игерілді.  Ал 1948 жылы Р.Риченс сөзді буынға бөлу ережесін ұсынды. Машиналы аударма жүйесі келесі екі он жылдықта қарқынды дамыды. 1954 жылы қаңтарда IBM-701 машинасында IBM Mark II машиналы аударманың бірінші жүйесі көрсетілді. Бірақ 1967 жылы АҚШ Ұлттық Ғылымдар Академиясы арнайы тағайындалған комиссиясы машиналы аударманы тиімсіз деп шешті. Ал 80-жылдары экономикалау жағынан машинаны қолдану адаммен салыстырғанда тиімді бола түсті.

Бірақ та СССР-де машиналы аударманы зерттеу ісі жалғаса берді. IBM Mark II жүйесінің демонстрациясынан кейін ВИНИТИ ғалымдар ұйымы БЭСМ машинасы үшін машиналы аударма жүйелерін әзірлей бастады.

Бірінші үлгідегі аударма ағылшын тілінен орыс тіліне аудару 1955 жылдың аяғында іске асты. Жұмыстардың басқа бағыты Қолданбалы математика бөлімшесінің АН СССР Математикалық институтында(бүгін ИПМ М.В.Келдыш РАН атында) А.А.Ляпуновтың бастауымен пайда болды. Бұл ұжыммен игерілген машиналы аударма бағдарламасының біріншілері Стрела машинасында жүзеге асырылды. Машиналы аударма жүйесін жасаудың арқасында қолданбалы лингвистика бағыты жұмыс жасады.                           70-жылдары Машиналы аударма жүйесін жасау үстінде профессор Г.Г. Белоноговтың басшылығымен ВИНИТИ РАН өңдеушілер ұйымы еңбек сіңірді. 1993 жылы олардың бірінші машиналы аударма жүйесі игерілген еді, ал 1996 жылы  толықтырулардан кейін РОСАПО-ға Retrans деген атпен тіркелді. Бұл жүйе қорғаныс министрлігі, қатынас жолдары, ғылымдар және технологияларда қолданылды.

 Параллел зерттеулер ЛГПИ А.И.Герцен атындағы Инженерлі Лингвистика (бүгінде Педагогикалық Университет) лабораториясында жүргізілді.Тап солар қазіргі өте әйгілі Машиналы Аударма “PROMT”-ты жүйелер негізіне жатқызды. Бұл программалық өнімнің соңғы болжамдарын ғылыми сыйымды технологияларда қолданып жатыр және формальді нейрондық желілер және ұлғаймалы технологиялық  желілер негізінде салынды.

Лари Чайлду машиналы аударма жүйелсінің классификациясы.

CompuServe компаниясының ағылшын тілдер форумының жаңа мүшелері көбінесе  оларға арзан бағаға жақсы аударатын машиналық бағдарлама ұсынатын біреулер бар ма деген  сұрақ қояды. 

Бұл сұраққа жауап өзгеріссіз жоқ. Жауапберушіге байланысты, жауап екі негізге дәлел бола алады, не аудармаға машиналардың күші жетпейді, немесе машиналы аударма өте кымбат болады. Нақтылы дәрежеде бұл екі дәлелдің туралығы әділ. Бірақ жауап қарапайым емес. Машиналы аударма мәселесін ескере отырып, бұл мәселенің  әр түрлі ішкі бөлімдерін жеке-жеке қарап шығу керек. 1990 жылы Техникалық Коммуникациялар бойынша Халықаралық Конференцияда Лари Чайлдстің дәрісінде келесі ажыратулар негізделген. 

- толық автоматты аударма;

- адамның қатысуымен болатын  автоматты машиналы аударма;

- адамның компьютерді қолдануымен іске асатын аударма;

- интеллектуалды жүйені қолданумен іске асатын аударма.

 Толық автоматты машиналы аударма

Машиналы аударманың бұл түрі көпшілігі адамдармен жобаланады. Бұл жерде мағына қарапайым, компьютерге бір тілде мәтін жүргізіледі, бұл мәтін қаралудан өтіп және компьютер бұл мәтінді басқа тілде шығарады. Өкінішке орай, жеңу әлі алда тұратын, автоматты аударманы іске асыру нақтылы бөгелулерге кезігіп қалып жатыр. Негізгі мәселе осындай сияқты тілдің күрделілігі болып отыр. Мысалға , «can» сөзінің мәнін аламыз. Модалді қосалқы етістіктің негізгі мәнінен басқа, «can» сөзінде бірнеше ресми және жаргондық мәндері банк зат есімдік сапада болып тұр, дәрет алатын орын, түрме. Бұдан басқа, бұл сөздердің көне мағынасын - білу немесе түсіну болып тұр. Егер болжасақ, аударылатын тілдегі сөздердің әрқайсысының жеке-жеке мағынасы әр түрлі,компьютер қалай оларды ажырата алады. Көрсеткендей, нақтылы жетістіктер аударма бағдарламаларын әзірлеу саласында жеткен еді, контекстік мағынадағы тұрақтылықты танып білеміз. Кейінгі зерттеулер мәтіндерді талдауда ықтималдық теориясына көбірек арқа сүйеп жатыр. Мәтіндердің толық автоматты машиналы  аудармасы көлемді тақырыптарда орындалмаған тапсырма болып отыр.

Қазіргі уақытта әбден іске асқан адамның қатысуымен болатын автоматты машиналы аударма. Адамның қатысуымен болатын  машиналы  аударма туралы айтқанда, әдетте мәтін редакциялауға дейін және олардың компьютер өңдеуінен кейінгі деген сияқты түсінік пайда болады. Адамдар-аудармашылар мәтіндерді машиналарға түсінікті болатындай өзгертеді. Содан кейін  компьютер аударманы жасаған сияқты, адамдар тағы-мұндай дөрекі машиналы аударманы редакциялап  мәтінді аударылатын тілде мағынасын дұрыстайды. Осындай реттік жұмыстан басқа машиналы аударма жүйелері бар,аударма кезінде  адам-аудармашының тұрақты қатысуын талап ететін, компьютерге  аса күрделі немесе бірмәнді емес конструкцияларды аударуға көмектесу.

Адам көмегімен болатын машиналы  аудармада үлкен дәрежеде қолданылатын мәтіндерге тақырыптар шектелген.

Адамның көмегімен болатын  машиналы аударманы қолданудың үнемділігі туралы сұрақ әлі де даулы. Бағдарламаның өзі әдетте жеткілікті қымбат, ал жұмыс үшін олардан арнайы жабдық керек, алдын ала және келесі редакциялауға оқу қажет, ал бұл жұмыс оңай емес. Осы базадағы сөздерді жұмыс күйінде жасау және сүйемелдеу – үрдіс сыйымды және арнайы дағдыларды талап етеді.

Бірақ ұйым үшін, аударылатын үлкен көлемді мәтіндердің айқын-нақтылы тақырыптық салада, адамның көмегімен болатын машиналы аударма жеткілікті үнемді дәстүрлі адами аударма екенін көрсете алады.

Адамның компьютер қолдануымен іске асатын аударма.

Бұл тұрғыда адам-аудармашы аударма процесін орталыққа жинайды, сол уақытта компьютердің бағдарламасы аспаптық сапада бағаланып, аударманың істеуші процесі көп тиімді, ал аударма – дәл болады. Тиісті сөздерді аудармамен қамтамасыз ететін бұл кәдімгі электрондық сөздіктер, ауысып кеткен мәтіннің маңызды варианттарын және мағынасын таңдау жауапкершілігін адамға тапсырады. Мұндай сөздіктер аударма процесін едәуір жеңілдетеді, бірақ оның жүзеге асырылуына уақыт және  тілден нақтылы білімі бар қолданушыны талап етеді. Сонда да аударма  процесі едәуір үдеп және жеңілденіп жатыр.

Жүйелердің ішінде Translation Memory (TM) деп аталатын жүйелер аудармашы  жұмысына көмектесіп ең маңызды орын алуда. Translation Memory (TM) жүйесі өздігінен мәліметтер қорына жинақтаушы аспап баламалы сегменттерінің аударма тіліндегі мәтіннің түпнұсқасын және аударма мүмкіндігін олардың келесі іздестіруімен және редакциялауын ұсынады. 

Аудармашы жұмыс үрдісінде өзі мәліметтер қорын қалыптастырады(немесе оны басқа аудармашылардан алады немесе тапсырма берушіден), және көбірек бірліктер болса, соғұрлым көбірек серпу қолданылады.

Міне өте белгілі ТМ жүйелердің тізімі

- Transit швейцария фирмасы Star,

- Trados (АҚШ),

- Translation Manager IBM-нан,

- Eurolang Optimizer француз фирмасы LANT,

- ATRIL (АҚШ-тан) DejaVu,

- WordFisher (Венгрия).

ТМ  жүйесі мәтіннің ұқсас бөліктерің қайталап аудару мүмкіндігін береді. Сегменттің аудармасы тек қана бір рет аудармашымен іске асады, ал содан соң әрбір келесі сегмент мәліметтер қорымен (толық немесе айқын емес) ұқсастығын,сәйкестігін тексереді,егер ұқсас не сәйкес сегмент табылса онда ол аударма түпнұсқасы ретінде  ұсынылады.

Қазіргі уақытта ТМ жүйелерін жетілдіру бойынша әзірлеулер жүргізіліп жатыр. Мысалы, Transit жүйесінің өзегі Star фирмасының нейрондық желілер технологиясы негізінде жүзеге асырылған.

TM жүйелерінің кең ассортиментіне қарамай, олар бірнеше ортақ функциялардан тұрады.

- (Alignment) салыстырулар функциясы. ТМ жүйелерінің бір артықшылығы – бұл осы тақырып бойынша енді аударылған материалдарды қолдану мүмкіндігі. ТМ-нің  мәліметтер қоры сегмент жолымен түпнұсқа және аударма файлдарын салыстыру мүмкіндігінен алынған.

- толық сәйкес келу немесе айқын емес іздестіру механизмі. Тап бұл механизм ТМ жүйелердің негізгі қасиетін ұсынып отыр. Егер мәтінді аудару кезінде жүйе сегментке жолықса, бұрын ұқсас немесе жақында аударылған, онда аударылған сегмент аудармашыға ағымдағы аударылған сегмент варианты ретінде ұсынылады.Айқын емес дәрежеде сәйкес келулер қолданушыға тапсырылады.

- тақырыптық сөздіктердің қолдауы. Бұл функция аудармашыға глоссариді ұстап тұруға көмектеседі. Ереже бойынша,егер аударылатын сегментте сөз, немесе сөз тіркесі тақырыптық сөздікте кездессе, ол  басқа түспен ерекшеленеді және аударылатын мәтінге оның аудармасын автоматты түрде ұсынады.

- мәтіннің фрагментін іздестіру құралдары. Бұл аспап аударманы редакциялауда өте ыңғайлы. Егер жұмыс барысында әлдеқандай аударманың сәтті варианты немесе мәтіннің фрагменті табылған болса, онда бұл фрагмент ТМ-нің барлық сегменттерінде табылуы мүмкін, осыдан кейін ТМ сегменттерінде біртіндеп қажетті өзгерістер енгізіледі.

Әрине кез келген бағдарламалық өнім сияқты, ТМ жүйелердің өз артықшылықтары мен кемшіліктері бар, және өзінің қолдану аймағы бар. Бірақ TM жүйелерінің негізгі кемшілігі олардың қымбатшылығы болып отыр.

Әсіресе, ТМ жүйелерін басқару нұсқаулықтары, конструкторлық және іскерлік құжаттама, өнім тізбелері,сондай-ақ бірыңғай құжаттаманы аударуға қолдану ыңғайлы.

Машиналы аударма (МА) жүйелері

Жоғарыда көрсетілген классификациялық сәйкестікте,көрсетілген жұмыстың мақсаты МА жүйесінің екінші түрін зерттеу және талдау болып отыр.

МА жүйелерін мәтіннің автоматтандырылған аудармасы жүзеге асырады. Аударма бірліктері мұнда сөз немесе сөз тіркесі қызметін атқарады, және де соңғы әзірлеулер аударылатын сөздің морфологиясын еске алуға мүмкіндік береді. Дамыған МА жүйелері өңдеуші аударма бойынша немесе қолданушы түзететін аударма алгоритмдерін жүзеге асырады.

Машиналы аударманы жүзеге асыру үшін компьютерге арнайы аударма алгоритмін іске асыратын бағдарлама орнатылады.  Машиналы аударма жүйесі өзі екі тілде сөздіктер қосады, қажетті грамматикалық мәліметпен жабдықталған (морфологиялық, синтаксистік және семантикалық) баламалылықты қамтамасыз ету үшін, вариантты және трансформациялық аударма сәйкестіктерін, ал сонымен бірге грамматикалық талдаудың алгоритмдік құралдарын, іске асыратын әлдеқандай үстірт грамматикалық мәтінді автоматты өңдеу үшін қабылданған. Сонымен бірге машиналы аударманың жеке жүйелері бар, өлшеулі үш және одан да көп тіл шеңберінде аудару, бірақ олар қазіргі уақытта эксперименталді болып отыр.

Қазіргі уақытта МА жүйесін дамытудың екі тұжырымдамасы бар:

« Күрделі құрылыммен  үлкен сөздік »модель(үлгі), қазіргі заманауи аудармашылық - бағдарлама;

 « мағына-мәтін» моделі(үлгі), алғаш рет А.А Ляпунов сипаттаған, бірақ әлі бір коммерциялық өнімде жүзеге асырылған емес.

Машиналы аударма қазіргі уақытта сапасы жағынан көп жетістіктерге жетуі мүмкін, және мұндай жүйелерді ғылыми зерттеу ретінде қабылдаған дұрыс сияқты. МА жүйелерін қолдану жобасы жұмыс барысында көп жағдайда ақтаған емес, себебі:

- МА жүйелер аударылатын мәтіннің қолайлы сапаларын бермейді. Жоғары сапаға қол жеткізу үшін жүйені алдын ала күйге келтіру көмегімен (бұл үшін PROMT XT топтама өнімдері қолданушыға көптеген мүмкіндіктер береді), аздаған көлемді аударылатын мәтінде мүлтіксіз қолайсыз, немесе келесі редакциялау жолымен,ал бұл тек қана жұмысты баяулатады.

- МА жүйелері терминология бірліктерінің орындалуына кепілдік бермейді, әсіресе үлкен жобаның жұмыс үстінде аудармашылар ұжымында.

Дәлірек, қолданбалы сөздіктермен өте мұқият көңіл бөлу шартына бағына кепілдік бере алады, ал бұған әрдайым үміт артуға болмайды.

Алайда, МА жүйелерді қолдануда кейбір жағдайларда барлық уақытша шығындарды қысқартуға көмектесіп жатыр. Егер мәтін жеткілікті көлемді және бір бейнелі терминология болса, онда МА жүйесі салыстырмалы тез күйге келтіруге мүмкіндік береді. Сонда мәтінді редакциялау өте көп уақытты алмайды. Бірақ бұл жағдайда әсіресе аударма мәтінінің стиліне ерекше көңіл аудару керек. Машиналы аударма формалді (үстірт), сондықтан тілдің түпнұсқасының синтаксистік құрылымдарының өзгертпей түсіріп алу ықтималдығы жоғары, тіпті аудармаға тән редакциялауда өткізіп алу әбден мүмкін.