К.филол.н. Мамаев К.С.

Академический инновационный университет, Республика Казахстан

 

Статистическое распределение слов по морфологическим классам в текстах учебников начальных классов казахских школ и детской литературы

 

Рассмотрим некоторые количественные и качественные характеристики морфологической структуры текстов учебников начальных классов (УНК) 1970-х, 1990-х гг., учебников Ана тілі и его хрестоматии 2000 гг. и детской дитературы (ДЛ), на базе которых были составлены частотные словари [1].

Сравнительные данные, приведенные в таблице №1, показывают, что наибольший объем в частотных словарях  (ЧС) слов рассматриваемых текстов приходится на имена существительные, затем идут глаголы, на третьем месте стоят прилагательные. Меньше всего в ЧС встречались модальные слова, междометия и союзы.

Данные, приведенные в таблице, показывают, что во всех сопоставляемых текстах грамматические классы показывают, приблизительно, одинаковые распределения. Можно подчеркнуть, что в текстах ДЛ местоимения употребляются в 5 раз больше, чем в остальных  текстах. Числительные занимают в текстах УНК 1990-х и 1970-х гг. седьмое место, а в текстах ДЛ стоят на, последнем, десятом месте.

Таблица 1

 Распределение грамматических классов 

  Грамматический класс

Удельный вес  в % в ЧС

УНК

(2000 г.)

УНК

(1990 г.)

УНК

(1970 г.)

ДЛ

Числительные (A)           

0,46

0,77

0,92 

0,52

Модальные слова (Д)         

0,16

0,36 

0,43

0,59

Глаголы (E)                 

29,01

27,47   

24,24

22,02

Имена существительные (З)   

45,31

42,70 

42,78

42,50

Звукоподражательные слова (Л)

1,38

 1,34 

 1,30

 1,07

Местоимения (M)             

0,94

 1,48 

 1,31

 6,50

Междометия (O)              

0,90

 0,46  

 0,62

 0,95

Имена прилагательные (C)    

17,83

20,03

 21,18

 18,77

Наречие (У)                 

3,38

 4,83

 6,48

 6,40

Союзы (Ш)

0,63

 0,56

 0,74

 0,68

Всего:

100,00

100‚00

100‚00

 100‚00

 

Линейное распределение порядковых статистик  морфологических  классов  слов  в  ранжированном  ряду  приводится в таблице №2.

Таблица 2

   Линейное распределение порядковых статистик морфологических классов

ЧС слов

1

2

3

4

5

6

7

8

9

10

УНК (2000 г.)

(З)

>(Е)

>(С)

>(У)

>(Л)

>(М)

>(О)

>(Ш)

>(А)

>(Д)

УНК (1990 г.)

(З)

>(Е)

>(С)

>(У)

>(М)

>(Л)

>(А)

>(Ш)

>(О)

>(Д)

УНК (1970 г.)

(З)

>(Е)

>(С)

>(У)

>(М)

>(Л)

>(А)

>(Ш)

>(О)

>(Д)

ДЛ

(З)

>(Е)

>(С)

>(М)

>(У)

>(Л)

>(О)

>(Ш)

>(Д)

>(А)

 

В рассматриваемых ЧС слов суммарный объем существительных, глаголов и прилагательных составляет 82-92% от общего объема словаря.

В таблице №3 приводится сопоставительные данные по классу имен существительных для текстов УНК 2000-х, 1990-х, 1970-х  гг. и ДЛ.

Таблица 3

Сопоставительные данные по классу имен существительных

Имя существительное

УНК (2000 г.)

УНК

(1990 г.)

УНК

(1970 г.)

ДЛ

1.

Собственные (CV)        

30,92

24,23

18‚67

32,06

 

 

 

 

 

 

     антропонимы (A)           

20,69

17,22

12,29

23,24

     сокращенные слова (S)    

0,27

0,58

0,11

0,40

     названия научных трудов,                              

  учебников и т.д. (N)           

2,72

0,31

0,19

-

     топонимы (T)               

5,31

5,08

5,42

7,67

     исторические названия (I)           

1,14

0,64

0‚53

0,60

     называния животных (Z) 

0,78

0,40

0,13

0,15

   2.

Нарицательные (NR)

69,08

75,77

81‚33

67,94

 

              Итого:

100,00

100‚00

100‚00

100‚00

 

Из общего количества имен существительных (таблица №3) в текстах ДЛ удельный вес имен собственных соответственно в 1,3 и 1,7 раза выше (32,06%), чем в текстах УНК 1990-х (24,23%) и 1970-х (18,67%) гг. Сопоставительный  анализ  удельного  веса  антропонимов в данных текстах показывает, что среди собственных имен существительных именно они употребляются намного больше, чем остальные. Например, в УНК 2000-х г. они составляют 20,69%  от общего количества имен существительных, в УНК 1990-х г. – 17,22%, в УНК 1970-х г. - 12,29% и в ДЛ - 23,24%. В исследуемых текстах антропонимы и топонимы занимают, соответственно, первые и вторые места (см. табл. 4).

Если в УНК 1990-х и 1970-х гг. собственные  имена существительные составляют около 20% от общего объема существительных, то в ДЛ и УНК 2000-х г. они достигают до 30-32%. В то же время удельный вес нарицательных имен существительных в текстах УНК 2000-х г. и ДЛ намного меньше, чем в текстах данных УНК 1970-х и 1990-х гг. Это показывает довольно высокую употребительность собственных имен существительных в текстах ДЛ и УНК 2000-х г.

Таблица 4

   Линейное  распределение  порядковых статистик имен существительных

ЧС слов

1

2

3

4

5

6

УНК (2000 г.)

(A)

>(T)

>(N)

>(I)

>(Z)

>(S)

 УНК (1990 г.)

(A)

>(T)

>(I)

>(S)

>(Z)

>(N)

УНК (1970 г.)

(A)

>(T)

>(I)

>(N)

>(Z)

>(S)

ДЛ

(A)

>(T)

>(I)

>(S)

>(Z)

   -

 

Морфологические классы слов употребляются в ЧС слов УНК 1990-х и 1970-х гг. в общем единообразно. А линейное распределение порядковых  статистик  морфологических классов слов ЧС УНК  1990-х, 1970-х гг. и  ДЛ показывает, что числительные в текстах УНК занимают седьмое место, а в текстах ДЛ стоят на последнем, десятом месте. Это можно объяснить тем, что в начальных классах имеются учебники математики, увеличивающие количество числительных.

Выводы, полученные из исследования статистической структуры ЧС слов  УНК 1970-х, 1990-х, 2000-х гг. и ДЛ, дают основание считать, что для характеристики словарного состава текстов учебников за некоторые периоды необходимо рассматривать не просто перечень слов, входящих в данный ЧС, но слова вместе с их частотами в тексте и что при сравнении ЧС следовало бы учитывать также и то, насколько сходны частоты слов, общих для сравниваемых ЧС.

 

Литература:

1.        Мамаев К.С. Лингвостатистический анализ лексических единиц (по учебникам начальных классов “Ана тілі” и его хрестоматии): автореф. ... канд. филол. наук: -Алматы, 2009.-32 с.

2. Мамаев К.С. Лингвистическая природа наиболее высокочастотных слов текстов УНК 1990-х, 1970-х гг. и детской литературы // Наука и образование Южного Казахстана. -Шымкент, 1998. -5(12). -С.141-145.