Қайырбекова Ұ.С. ф.ғ.к., доцент
ҚИПХДУ, Қазақстан
Жахаева Г. ҚИПХДУ магистранты
Қазіргі тіл біліміндегі
статистикалық әдістің қалыптасуы.
Қазақ тіл білімінде құрмалас сөйлемдер құрылымын
статистикалық әдіспен зерттелу мәселесін зерделеу алдымен
осы тақырыпқа байланысты баспадан шыққан
лингвистикалық, лингвостатистикалық еңбектерге шолу жасауды
керек етеді. Алайда ескеретін мәселе: ХХ ғасырдың басынан
бастап қазіргі күнге дейін жарық көрген
лингвостатистикалық зерттеулерде тілші – ғалымдар балаларға
арналған мәтіндердегі құрмалас сөйлемдердің
құрылымын статистикалық әдіс арқылы зерттеу
жөнінде тікелей сөз етпеген. Бұдан бұрынырықта
шыққан зерттеулер мен лингвостатистикалық еңбектерде қазақ
мәтіндері жай сөйлемдерінің құрылымы
қарастырылмаған деген пікір тумауы керек. Қазақ тіл
білімінде лингвостатистикалық әдісті негізін қалаған
ғалымдардың еңбектерінде жай сөйлемдердің
құрылымын лингвостатистикалық зерттеуге арналған
тұжырымдардың бірізділікке түспегеніне қарамастан,
мәтіндер құрылымындағы тілдік бірліктерді
анықтауға, тілдік бірліктердің сандық және
сапалық ерекшеліктерін айқындауға арналған
құнды пікірлер мен тұжырымдар жетерлік.
Статистикалық әдісті тіл саласында
қолдануды ең алғаш ұсынған орыстың белгілі
математик-ғалымы В.Я.Буняковский (18041889). Содан кейін тілді зерттеуде
сандық деректерге жүгінудің қажеттілігін И.А.Бодуэн де
Куртенэ, А.М.Пешковский, М.Н.Петерсон, Е.Д.Поливанов, В.В.Виноградов және
т.б. ғалымдар атап көрсеткен.
В.В. Виноградов тілдің кітаби,
сөйлеу түрлерінде және көркем әдебиет
стилінің әр жанрларында сөздердің қолдану
жиілігінің біркелкі еместігін айта келе, оларды анықтау үшін
арнайы зерттеудің қажеттігін көрсеткен. Ғалымның
тұжырымдауынша, мұндай зерттеулер түрлі стильдердің
семантикалық, құрылымдық-грамматикалық,
айырмашылықтарын белгілеуге, сондай-ақ грамматиканың
барлық категорияларына статистикалық талдау жүргізілген
әр әдеби стильдің қатынастық-функционалдық
салмағын айқындауға мүмкіндік туғызады.
Ф.П.Филин өзінің бір
еңбегінде: «Ғылымның бір-ақ мақсаты болады, ол –
әлі ашылмаған шындықты ашу немесе соның ашылуына
ықпал жасау, сол арқылы қоғамға қызмет ету.
Алға қойған мұндай мақсатқа әр түрлі
жолмен жетуге болады. Соның ішінде зерттеудің дәлдігі мен
объективтілігін қамтамасыз ететін тәсіл ғана ең
дұрысы болмақ. Дәлдік пен объективтілікке ұмтылу
қазіргі ғылымның туы. Бұл тіл біліміне де
қатысты» – деп жазады.
Лингвистика мен математика салаларын байланыстыра зерттеу
бары-
сында –
«математикалық лингвистика» атты жаңа пән өмірге келді.
ХХ ғасырдың 50-60 жылдары қалыптасқан бұл
пән тіл білімінің барлық ішкі дамуының өзінен де
сезіле бастаған қажеттілігінен туындаған болатын. Атап
айтқанда, бұл қажеттілік тілдің
лексика-грамматикалық, фонетикалық құрылымына
көңіл аударудан, тілдік жүйе ретінде қарастырудан
және оның жеке-жеке микрожүйелерден тұру
күрделілігін жете түсінуден, лингвистикалық нысандар мен
олардың атрибуттары аралығындағы қатынастарды
танып-білуден байқалып, математикалық лингвистика
пәнінің дамуына объективті жағдай туғызды. Сөйтіп
құрылымдық лингвистика мен математикалық лингвистика
пәндері қазіргі қазақ теориялық тіл
білімінің дамуына ең көп әсер етуде. Бұндай
әсер қазіргі қазақ тіл білімінің синтаксис
және семантика салаларында айтарлықтай көрініс тапты.
Жай сөйлемдерді лингвостатистикалық зерттеу тіл білімінде
мына мәселелер бойынша қажет:
а) қазақ және басқа тілдердегі сөйлем
құрылымын өзара салыстыру ;
ә) жазба ескерткіштер мен мәтіндік материалдар қоры
бойынша таңдама жұмыстарындағ сөйлем
құрылымдарын анықтау;
б) тілдік материалдар арқылы сөйлем
құрылымының моделдерін айқындау;
в) тілдік материалдарды жан-жақты сұрыптау,
сөйлемдердің синтактикалық ақпараттық
өлшемдерін нақтылау;
г) ақпараттық – типологиялық өлшемдер бойынша
реестрлер, каталогтар сипаттамаларын жинақтау, тіл білімінде синтаксис
ғылымының сандық негізін айқындау;
д) статистикалық, картографикалық, сұрыптау теориясы
мен жүйелік талдау әдістерін қолдану;
Осыларды жүзеге асыру арқылы, ғылыми жұмысты
автоматтандыру үдерісінде құрастырылған жүйе
негізінде тұтынушы маманға қажетті тарихи деңгейде
зерттеу нысанына қатысты барынша толық энциклопедиялық білім
және библиографиялық мәліметтер беріледі. Статистикалық
лингвистика, математикалық статистика әдістемесіне сүйенеді.
Себебі қатынас құралы қызметіндегі тіл белгілі бір
жүйе, және ол ақиқат болмыста өмір сүретін
көп өлшемді және белгілі бір ішкі
заңдылықтардың негізінде топталған (реттелген)
табиғи құбылыс. Бұлар математикалық статистика
заңдылықтарына бағынатын, тілдік жүйедегі бірліктер
тобы қайталанып отыратын және кездейсоқтық сипатта
болатын тілдік элементтерден тұрады. Олай болатын себебі, тіл
қызметі кезінде (яғни тілдік қарым-қатынас кезінде)
дыбыстар, сөздер, сөз тіркестері, сөйлемдер және одан
да үлкен бөліктер қайталанбайтын сипатта болса, адамдар
арасындағы тілдік қатынас бұзылып, сөйлеуші мен
тыңдаушы арасында бірін – бірі түсінбестік пайда болар еді.
Сондықтан да тілдік бірліктердің қайталануы мен олардың
қолданылу сипатына жиі, сирек
деген ұғымдар тән.
Статистика тәсілімен тілге тән
заңдылықтарды анықтау негіздемесі мынада:
1) сандық (мөлшерлік) құбылыс тіл
табиғатына әуелден-ақ тән болуы;
2) тіл құрылымындағы
сандық және сапалық сипаттардың өзара байланыста
болуы;
3) тілдің әр түрлі
бірліктері сөйлеу ағымында статистикалық заңдылықтардың
ең болмағанда біреуіне бағынуы тиіс деп ұйғару
керектігі.
Тілдің
ықтималды-статистикалық моделі белгілі бір тілдік
жүйенің мәтіндері арқылы жасалса, тілдің
логика-математикалық моделі сол тілдің толық жүйесін
айқындай алады. Нәтижесінде, сөйлесім, тілдесім сияқты
т.б. тілдік үдерісті байланыс өзегі (канал связи) не байланыс жолы
пайда болады. Ал мұндай байланыс жолы арқылы таратылатын
ақпарат әріп, дыбыс, морфема және т.б. лингвистикалық
бірліктер арқылы жүзеге асады. Мұнда лингвистикалық
бірліктер белгілі бір «кодтың» символдары ретінде жұмсалады да
байланыс өзегіндегі хабарлаушы мен қабылдаушы, яғни айтушы
мен тыңдаушы өзара бірдей «кодты» пайдаланады.
Қазақ тіл білімінде статистикалық әдіспен тілді
зерттеу ХХ ғасырдың басынан бері қолданылуда, дегенмен ол
кезде жекелеген зерттеушілердің ізденістерінде ғана кездессе,
қазір статистикалық лингвистика жеке ғылыми пән,
ғылыми бағыт ретінде қалыптасты. Осыған орай
статистикалық лингвистика саласы ќазаќ тіл білімінде өзіне
тән алға қойған теориялық және
практикалық мақсаты мен міндетін єлі де айқындай жетілдіре
түсуде. Себебі қай ғылым саласын болмасын өзі
қарастыратын мәліметтердің дәл және объективті
болуын қалайды, ал лингвистика – қоғамдық
ғылымдар ішіндегі осындай дәлдікті көп қажет ететін
сала.
Орыстың көрнекті математигі
В.Я.Буняковский 1847 жылдың өзінде-ақ тіл зерттеу
тәжірибесіне статистикалық әдіс-тәсілді ықтималдық
жіктеудің мүмкіншіліктерін атап, филологтар мен
математиктердің бірлесе еңбек етуінің қажеттігін
айтқан болатын.
Түркі тіліндегі мәтіндерді статистикалық
тәсілмен зерттеу – бұл тілдің агглютинативті
құрылымына негізделеді. Бұлайша зерттеу кітаби және
сөйлеу тіліндегі түрлі типті сөздердің әр
ыңғайдағы қолдану жиілігін анықтап тілдің
құрылымдық–грамматикалық, кейде
стильдік-семантикалық айырым белгілерін ажырата отырып, осы стильдерге
тән қасиеттерді айқындайды, соған мүмкіндік
жасайды. Бұған қоса статистикалық тәсілмен талдау
грамматикалық категорияларды әдеби тілдің барлық
аясындағы функционалдық салмағын көрсетуде де
маңызды.
Белгілі
филолог–статист Р.Г.Пиотровский үнді-европа тілдеріне тән екпінді
ассимиляция мен редукциялар түркі тілдеріне мүлдем жат. Оны
олардың ішкі құрылымдық табиғатына сәйкес
қана сандық тұрғыдан зерттеуге болатындығын атап
көрсеткен болатын. Себебі бұл қасиет тілдік деректердің
жай кезде қиындық туғызатын кейбір тұстарын
математикалық әдіспен тіркеу мен тануда аса маңызды деп
саналады.
Жалпы тілдік мәселелерге қолданылатын
математикалық әдіс интуитивті түрде
тұжырымдалған, сол сияқты толық шешімі жоқ
мәселелердің логикалық тұжырымдалуына бағынатын
және алгоритмдік шешімі бар бір немесе бірнеше қарапайым
математикалық есептермен ауыстыру деп ұғынылды.
Қазақ тіл білімінде статистикалық
әдістің тарихи қалыптасуында Қ.Жұбанов, І.Кеңесбаев,
М.Балақаев, А.Ысқақов, Ғ.Мұсабаев,
А.Қ.Жұбанов, Ж.Аралбаев, Қ.Молдабек, С.Мырзабеков,
Ә.Ахабаев, Д.Молдалиева, А.Белботаев, Б.Қалыбеков т.б. тілші
ғалымдардың еңбектерін ерекше атап көрсету қажет.
Себебі, аталған ғалымдардың лингвостатистикаға
арналған еңбектері қазақ тіл білімінде
лингвостатистикалық әдісті қолданудың
әдіс-тәсілдерін жан-жақты баяндап, анықтап беруінде
ғана емес, жалпы қазақ тіл білімінде тілдік
бірліктердің өзіндік ерекшеліктерін айқындағаны
үшін елеулі орын алады.
Қазақ тілі білімінде
лингвостатистикалық әдістің қалыптасу тарихын сөз еткенде алдымен ауызға
Құдайберген Қуанұлы Жұбанов ілінеді. Мұны белгілі
тілші-статист ғалымдар – Қ.Б.Бектаев, С.Мырзабеков, т.б.
қазақ тілінің статистикасы туралы зерттеулері мен
мақалаларында атап көрсеткен. Мәселен, С.Мырзабеков
«Қазақ тілін зерттеуде санды пайдалану» атты мақаласында:
«Қазақ совет тіл білімінің негізін қалаушылардың
бірі, совет дәуірінде қазақ тілін тұңғыш
рет ғылыми түрде зерттеген маман-лингвист Қ.Жұбанов
ретіне қарай сандық деректерді де пайдаланған» десе,
ғалым Қ.Б.Бектаев «Лингвистикалық статистикаға
қатысты элементтерді – сандық деректер мен мәліметтерді, оны
пайдалану нәтижесіндегі кейбір пікірлер мен тұжырымдарды біз
профессор Қ.Жұбановтың еңбектерінен жиі кездестіреміз»,
– дейді.
Қ. Жұбанов – қазақ тіл
білімінің өркендеуіне ерекше еңбек сіңірген,
қазақ тілінің грамматикалық терминологиясының
негізін қалаған білгір ғалым. Сонымен қатар,
ғұлама ғалым қазақ тіл білімінің
заңдылықтарын айқындауда математикалық әдістерді қолдануды
да жөн деп санаған. Бұл тұрғыда
Қ.Жұбанов былай дейді: «Что касается существа дела, то премудрая
математическая формула построения алфавита была лишь ученым плагиатом. Это
перевоплашенная в математику казахская система сокращения букв, созданая для
заметания следов».
Ғұлама ғалым 1936 жылы шыққан
“Қазақ тілінің грамматикасы” атты еңбегінде «Дыбыстың
саны бар да, сапасы бар. Дыбыстың сапасы бірдей бола тұрып, саны
әлденешеу бола береді.... бір тілде жұмсалатын дыбыстардың
жалпы санының ұшы-қиыры жоқ, бірақ олардың
бәрінің сапасы әр түрлі бола бермейді....
Ілиястың небары он екі жол «Қойшы ойы» деген кішкене
өлеңінде 488 дыбыс бар. Бірақ 488 дыбыс түрлі емес,
мұнда небары 28-ақ түрлі дыбыс бар. Осы 28 түрлі
дыбыстың бірі 10, бірі 50 рет қайталанып барып, 488 болған.
Қазақ тілінде де сапасы әр түрлі болатын дыбыстардың
арнаулы саны бар». Сонымен қатар ғалымның еңбегінде сөйлемдегі
сөздердің орын тәртібі, қазақ орфографиясы,
дыбыстардың айтылу және жазылу ерекшеліктері, буындардағы
дыбыстардың сандық сипаты туралы тың пікірлер,
құнды тұжырымдар көптеп кездеседі. Қ.Қ.Жұбанов
сандық деректерді пайдалану жөніндегі пікірлерінен мынадай
қорытынды шығарды: профессор Құдайберген
Қуанұлы Жұбановтың қазақ тіл білімі туралы
зерттеулерінде тілді сандық деректер мен мәліметтер негізінде
қараудың алғашқы нышандары бар. Демек қазіргі
таңда тіл білімінің бір саласына айналып отырған
лингвистикалық статистиканы ғалым сол кездің
өзінде-ақ тани білген. Тілдің сандық сипатынан
байқалатын сапалық қасиеттерін, оны зерттеуде
пайдалануға болатын тиімді әдіс көздерінің бірі екенін
байқаған. Сөйтіп, ол сандық деректердің негізінде
тілге қатысты бірсыпыра жайларды (дыбыстар, буындар, сөздер,
сөйлем мүшелерінің орны т.б.) нақты анықтап,
кейбір тың тұжырымдар жасаған. Олар қазіргі кезде
бұл саладағы ізденуші-зерттеушілерге үлгі-тірек,
бағыт-бағдар болып маңыздылығы арта түсті.
Ғалымның
еңбегін талдай келе Қ.Жұбановтың қазақ тіл
білімінде лингвостатистикалық әдістің
қалыптасуындағы негізгі тұжырымдарын былайша топтауға
болады:
1.
Қ. Жұбанов – қазақ тіл білімінде
лингвостатистикалық әдістің алғашқы нышанын
жасаушы. Бұған ғалымның жоғарыда аталған
еңбегі мен пікірлері дәлел.
2.
Қазақ тілі заңдылықтарын айқындауда
математикалық әдісті қолданудың ұтымды жақтарын атаған.
3.
Ғалым қазақ тілінің дыбыстық жүйесі мен
орфографиялық заңдылықтарын анықтау үшін
статистикалық әдісті пайдалану тиімді деп есептеген.
ХХ ғасырдың отызынша жылдарының орта тұсында
қазақ тілінің дыбыс, буын жүйесінің
заңдылықтарын анықтауда статистикалық әдісті
пайдаланған тағы бір ғалым – Ғ.Бегалиев. Оның
бастауыш мектепке арналған “Әріп, дыбыс, буын” атты еңбегінде
осы мәселе арнайы қолданылған.
Қазақ
тілінің нормативті курсын жүйелеу мен жазу жұмысына профессор
Қ.Жұбановтан кейін белгілі тілші-ғалымдар: Н.Т.Сауранбаев, І.Кеңесбаев,
М.Балақаев, А.Ысқақов және т.б. ғалымдар ат салысты.
Бастауыш пен жоғары сыныптарға, педучилищелерге арналған
«Қазақ тілі» оқулықтарының авторлары тілдің
буындық құрылымын, дыбыс физиологиясын, тілдің
акценттік, екпіндік және т.б. мәселелеріне қатысты
зерттеулерінде сан мен сапаны бөлмей бірге қарастырады. Мысалы, І.Кеңесбаев
қазақ тіліндегі буын түрлерінің, М.Балақаев
сөз тіркестерінің табиғатын зерттеуде көптеген
нақты мәтіндік материалдарды сандық қатынастар
көмегімен қарастырған. Сандық талдауларды профессор
Ғ.Мұсабаевтың зерттеулерінен де кездестіруге болады. Аталған
ғалымдардың сандық қатынасқа көңіл
бөлуі тілдің ішкі табиғатына (сырына) қатысты
туындаған жағдай екені даусыз.