К.филол.н. Мамаев К.С.
Академический
инновационный университет, Республика Казахстан
Статистическое распределение слов по
морфологическим классам в текстах учебников начальных классов
казахских школ и детской литературы
Рассмотрим некоторые количественные и
качественные характеристики морфологической структуры текстов учебников начальных классов
(УНК) 1970-х, 1990-х гг., учебников “Ана тілі” и его хрестоматии 2000 гг. и детской
дитературы (ДЛ), на базе которых были составлены
частотные словари [1].
Сравнительные данные, приведенные в таблице №1, показывают, что наибольший объем в частотных словарях (ЧС) слов рассматриваемых текстов приходится на имена существительные, затем идут глаголы, на третьем
месте стоят прилагательные. Меньше всего в ЧС встречались модальные слова,
междометия и союзы.
Данные, приведенные в таблице, показывают,
что во всех сопоставляемых текстах грамматические классы показывают, приблизительно, одинаковые распределения. Можно
подчеркнуть, что в текстах ДЛ местоимения употребляются в 5 раз больше, чем в
остальных текстах. Числительные
занимают в текстах УНК 1990-х и 1970-х гг. седьмое место, а в текстах ДЛ стоят
на, последнем, десятом месте.
Таблица
№1
Распределение
грамматических классов
|
Грамматический класс |
Удельный вес
в % в ЧС |
|||
|
УНК (2000 г.) |
УНК (1990 г.) |
УНК (1970 г.) |
ДЛ |
|
|
Числительные (A) |
0,46 |
0,77 |
0,92 |
0,52 |
|
Модальные слова (Д) |
0,16 |
0,36 |
0,43 |
0,59 |
|
Глаголы (E) |
29,01 |
27,47 |
24,24 |
22,02 |
|
Имена существительные (З) |
45,31 |
42,70 |
42,78 |
42,50 |
|
Звукоподражательные слова (Л) |
1,38 |
1,34 |
1,30 |
1,07 |
|
Местоимения (M) |
0,94 |
1,48 |
1,31 |
6,50 |
|
Междометия (O) |
0,90 |
0,46 |
0,62 |
0,95 |
|
Имена прилагательные (C) |
17,83 |
20,03 |
21,18 |
18,77 |
|
Наречие (У) |
3,38 |
4,83 |
6,48 |
6,40 |
|
Союзы (Ш) |
0,63 |
0,56 |
0,74 |
0,68 |
|
Всего: |
100,00 |
100‚00 |
100‚00 |
100‚00 |
Линейное распределение порядковых
статистик морфологических классов
слов в ранжированном ряду приводится в таблице №2.
Таблица №2
Линейное
распределение порядковых статистик морфологических классов
|
ЧС слов |
№1 |
№2 |
№3 |
№4 |
№5 |
№6 |
№7 |
№8 |
№9 |
№10 |
|
УНК (2000 г.) |
(З) |
>(Е) |
>(С) |
>(У) |
>(Л) |
>(М) |
>(О) |
>(Ш) |
>(А) |
>(Д) |
|
УНК (1990 г.) |
(З) |
>(Е) |
>(С) |
>(У) |
>(М) |
>(Л) |
>(А) |
>(Ш) |
>(О) |
>(Д) |
|
УНК (1970 г.) |
(З) |
>(Е) |
>(С) |
>(У) |
>(М) |
>(Л) |
>(А) |
>(Ш) |
>(О) |
>(Д) |
|
ДЛ |
(З) |
>(Е) |
>(С) |
>(М) |
>(У) |
>(Л) |
>(О) |
>(Ш) |
>(Д) |
>(А) |
В рассматриваемых ЧС слов суммарный объем
существительных, глаголов и прилагательных составляет 82-92% от общего объема словаря.
В таблице №3 приводится сопоставительные данные по классу имен
существительных для текстов УНК 2000-х, 1990-х,
1970-х гг. и ДЛ.
Таблица №3
Сопоставительные данные по классу имен существительных
|
№ |
Имя существительное |
УНК (2000 г.) |
УНК (1990 г.) |
УНК (1970 г.) |
ДЛ |
|
1. |
Собственные (CV) |
30,92 |
24,23 |
18‚67 |
32,06 |
|
|
антропонимы (A) |
20,69 |
17,22 |
12,29 |
23,24 |
|
сокращенные слова (S) |
0,27 |
0,58 |
0,11 |
0,40 |
|
|
названия
научных трудов, учебников и
т.д. (N) |
2,72 |
0,31 |
0,19 |
- |
|
|
топонимы
(T) |
5,31 |
5,08 |
5,42 |
7,67 |
|
|
исторические названия (I)
|
1,14 |
0,64 |
0‚53 |
0,60 |
|
|
называния животных (Z) |
0,78 |
0,40 |
0,13 |
0,15 |
|
|
2. |
Нарицательные (NR) |
69,08 |
75,77 |
81‚33 |
67,94 |
|
|
Итого: |
100,00 |
100‚00 |
100‚00 |
100‚00 |
Из общего количества имен существительных
(таблица №3) в текстах ДЛ удельный вес имен собственных
соответственно в 1,3 и 1,7 раза выше (32,06%), чем в текстах УНК 1990-х
(24,23%) и 1970-х (18,67%) гг. Сопоставительный анализ удельного веса
антропонимов в данных текстах показывает, что среди собственных имен
существительных именно они употребляются намного больше, чем остальные.
Например, в УНК 2000-х г. они составляют 20,69% от общего количества имен
существительных, в УНК 1990-х г. – 17,22%, в УНК 1970-х г. -
12,29% и в ДЛ - 23,24%. В исследуемых текстах антропонимы и топонимы занимают,
соответственно, первые и вторые места (см. табл. 4).
Если в УНК 1990-х и 1970-х гг.
собственные имена существительные
составляют около 20% от общего объема существительных, то в ДЛ и УНК 2000-х г. они достигают до 30-32%. В то же время удельный вес нарицательных имен существительных в
текстах УНК
2000-х г. и ДЛ намного меньше, чем в
текстах данных УНК 1970-х и 1990-х гг. Это показывает
довольно высокую употребительность собственных имен существительных в текстах
ДЛ и УНК
2000-х г.
Таблица №4
Линейное распределение порядковых статистик имен существительных
|
ЧС слов |
1 |
2 |
3 |
4 |
5 |
6 |
|
УНК (2000 г.) |
(A) |
>(T) |
>(N) |
>(I) |
>(Z) |
>(S) |
|
УНК (1990 г.) |
(A) |
>(T) |
>(I) |
>(S) |
>(Z) |
>(N) |
|
УНК (1970 г.) |
(A) |
>(T) |
>(I) |
>(N) |
>(Z) |
>(S) |
|
ДЛ |
(A) |
>(T) |
>(I) |
>(S) |
>(Z) |
- |
Морфологические классы слов употребляются
в ЧС слов УНК 1990-х и 1970-х гг. в общем единообразно. А линейное
распределение порядковых статистик морфологических классов слов ЧС УНК 1990-х, 1970-х гг. и ДЛ показывает, что числительные в текстах
УНК занимают седьмое место, а в текстах ДЛ стоят на последнем, десятом месте.
Это можно объяснить тем, что в начальных классах имеются учебники математики,
увеличивающие количество числительных.
Выводы, полученные из исследования
статистической структуры ЧС слов УНК
1970-х, 1990-х, 2000-х гг. и ДЛ,
дают основание считать, что для характеристики словарного
состава текстов учебников за некоторые периоды необходимо рассматривать не
просто перечень слов, входящих в данный ЧС, но слова вместе с их частотами в
тексте и что при сравнении ЧС следовало бы учитывать также и то, насколько
сходны частоты слов, общих для сравниваемых ЧС.
Литература:
1.
Мамаев К.С. Лингвостатистический анализ лексических единиц (по учебникам
начальных классов “Ана тілі” и его хрестоматии): автореф. ... канд. филол.
наук: -Алматы, 2009.-32 с.
2. Мамаев К.С. Лингвистическая
природа наиболее высокочастотных слов текстов УНК 1990-х, 1970-х гг. и детской
литературы
// Наука и образование Южного Казахстана. -Шымкент, 1998. -№5(12). -С.141-145.