К.п.н. Бурмистрова В.А., магистрант Медиева С.К.

Карагандинский государственный медицинский университет, Казахстан,

Карагандинский государственный университет им. Е.А. Букетова, Казахстан

Тестовые задания и тест как наивысшие категории теории педагогических измерений

 

Качество результатов образовательного процесса (результативный аспект) в отличие от процессуальной стороны на сегодняшний день у многих педагогов-теоретиков и  (в особенности) –практиков стоит во главе угла, что, как мы считаем, связано с увеличением доли отчетной документации в системе образования. Как правило, определение качества результатов совместной деятельности обучающихся и педагогов ассоциируется с проведением различных видов контроля (предварительного, текущего, промежуточного, итогового и др.). Согласно Приказа МОН РК №125 от 18.03.2008 «Об утверждении Типовых правил проведения текущего контроля успеваемости, промежуточной и итоговой аттестации обучающихся» (пункт 4) высшие учебные заведения обладают правом выбора формы контроля для определения учебных достижений студентов [11]. Хотелось бы отметить, что среди форм контроля наибольшей популярностью на сегодняшний день пользуется тестирование как одна из наиболее объективных и экономичных форм проверки знаний.

Вопросы тестового контроля рассматриваются в трудах таких ученых – «столпов» педагогических измерений, как В.С. Аванесов [3], В.П. Беспалько [6], А.В. Поддубный [10] и др. В рамках казахстанской педагогической теории и практики различным аспектам тестирования посвящены работы О.Г. Блок [7], Р.С. Досмагамбетовой [9] и др. Что касается дальнего зарубежья, то здесь уместно было бы привести ссылки на труды Р. Берка [1], Г. Кингсбери [2].

Выбор тестирования в качестве ведущей формы контроля неслучаен и объясняется, по нашему мнению, следующими преимуществами тестового контроля:  

- технологичностью (определение учебных достижений максимального количества студентов за минимально отведенное время);

- объективностью (отсутствие субъективизма преподавателя при выставлении оценок);

- полнотой охвата содержания учебной дисциплины;

- дифференцирующей способностью и индивидуальным подходом к обучающимся (возможность подготовки разноуровневых / индивидуальных заданий тестового контроля);

- обучающей способностью и пр.

Однако при выборе тестирования в качестве ведущей формы контроля имеются и определенные нюансы, на которых мы бы хотели остановиться подробнее в данной статье. Дело в том, что правильно подобранное содержание задания, а также адекватная форма представления данного содержания – еще недостаточные условия для того, чтобы можно было назвать задание в тестовой форме «тестовым заданием». Для этого заданиям в тестовой форме необходимо соответствовать определенным статистическим требованиям, а именно:

1) задание должно быть известной трудности (если неизвестна трудность задания, то оно не является тестовым). С показателем трудности заданий связана доля неправильных ответов (qj) (см. таблицу 1).

2) задания должны обладать дифференцирующей способностью. Все задания, которые не имеют данной способности, не являются тестовыми заданиями. К ним относятся:

- такие задания, на которые все испытуемые отвечают правильно: слабоуспевающие студенты отвечают на представленные задания также верно, как и сильные обучающиеся, это свидетельствует о каком-либо дефекте задания, позволяющем угадать правильный ответ, то есть задание обладает низкой дифференцирующей способностью и не может рандомизировать испытуемых по уровню их подготовленности, либо задание является слишком легким;

- такие задания, на которые все испытуемые отвечают неправильно, что свидетельствует о повышенной трудности задания;

3) задания должны быть системными, что проверяется при установлении корреляции баллов каждого конкретного задания с баллами по всему тесту (см. таблицу 2).

Таким образом, «тестовое задание – это составная единица теста, отвечающая требованиям формы, содержания, технологичности и статистическим требованиям» [4].

Для определения тестовых свойств заданий в тестовой форме используются матрицы – «система каких-либо математических величин, расположенных в виде прямоугольной схемы» [12, с.237]. В теории педагогических измерений В.С. Аванесова под «матрицей» понимается «форма организации, сохранения, представления и обработки данных» [4]. Для достоверности измерений количество испытуемых (строки) должно быть больше количества предложенных заданий (столбцы). Минимальное соотношение должно быть не менее 5:1. Рассмотрим подобные расчеты на учебной матрице, приведенной в работе В.С. Аванесова «Проблема качества педагогических измерений» [4].

Следует сразу оговориться, что в матрицу не заносятся задания в тестовой форме, не обладающие дифференцирующей способностью (см. требование №2), а также данные всех «неподходящих» испытуемых. Таковыми являются те, кто набрал 0 баллов за весь тест (то есть, проанализировав результаты ответов данных испытуемых, мы не сможем сделать вывод о ценности заданий в тестовой форме), и те, кто получил 100 баллов (то есть это означает, что задания в тестовой форме являются слишком легкими для данных испытуемых и им требуется другой уровень сложности; либо данный факт может указывать на пролонгированное время тестирования, которое необходимо уменьшить в следующий раз для получения более достоверных данных).

Итак, матрица может выглядеть следующим образом, как это показано в таблице 1. 

Таблица 1 - Пример матрицы тестовых результатов [4]

Х1

Х2

Х3

Х4

Х5

Х6

Х7

Х8

Х9

Х10

Yi

pi

qi

pi/qi

lnpi/qi

 1.

1  

1

1

0

1

1

1

1

1

1

9

.90

.10

9

2.20

 2.

1

1

0

1

1

1

1

1

1

0

8

.80

.20

4

1.39

 3.

1

1

1

1

0

1

1

0

1

0

7

.70

.30

2.33

.85

 4.

1

1

1

1

0

1

0

1

0

0

6

.60

.40

1.50

.40

 5.

1

1

1

1

1

1

0

0

0

0

6

.60

.40

1.50

.40

 6.

1

1

1

1

0

0

1

0

0

0

5

.50

.50

1.00

0

 7.

1

1

0

1

1

0

1

0

0

0

5

.50

.50

1.00

0

 8.

1

1

1

1

1

0

0

0

0

0

5

.50

.50

1.00

0

 9.

1

0

1

0

1

1

0

0

0

0

4

.40

.60

.66

-.42

10

0

1

1

0

0

0

0

1

0

1

4

.40

.60

.66

-.42

11

1

1

1

0

0

0

0

0

0

0

3

.30

.70

.43

-.84

12

1

1

0

0

0

0

0

0

0

0

2

.20

.80

.25

-1.39

13

1

0

0

0

0

0

0

0

0

0

1

.10

.90

.11

-2.21

Rj

12

11

9

7

6

6

5

4

3

2

65 - ∑ Yi

 

 

 

Wj

1

2

4

6

7

7

8

9

10

11

 

 

 

 

 

pj

.923

.846

.692

.538

.462

.462

.385

.308

.231

.154

5 - M

 

 

 

qj

.077

.154

.308

.462

.538

.538

.615

.692

.769

.846

 

 

 

 

 

pjqj

.071

.130

.213

.248

.248

.248

.236

.213

.178

.130

 

 

 

 

 

qj/pj

.083

.182

.445

.859

1.164

1.164

1.597

2.246

3.329

5.493

 

 

 

 

 

lnqj/pj

-2.489

-1.704

-.810

-.152

.152

.152

.468

.809

1.202

1.703

 

 

 

 

 

 

Обозначения, используемые в матрице тестовых результатов:

Х – задание;

j – номер задания;

I – номер испытуемого;

N – количество испытуемых;

Yi – количество баллов за тест определенного испытуемого;

Yi – сумма баллов за тест всех испытуемых;

M – средний арифметический балл в группе;

Rj – количество правильных ответов в каждом конкретном задании;

Wj – количество неправильных ответов в каждом конкретном задании;

pj – доля правильных ответов по конкретному заданию - по формуле:

                Rj                

       pj =   N;

qj – доля неправильных ответов по конкретному заданию - по формуле:

                Wj                

       qj =   N;

pj* qj – дисперсия баллов по каждому конкретному заданию;

pj=M (5 – в нашем случае);

Rj= Yi (65 – в нашем случае);

Rj+ Wj=N (13 – в нашем случае);

pj+qj=1

При этом, как мы упоминали ранее, по вертикали располагаются Ф.И.О. (или же номера) испытуемых (в нашем случае их 13), по горизонтали – номера заданий (в нашем случае их 10). При этом, в первой строке располагается Ф.И.О. испытуемого, набравшего наибольшее количество баллов по тесту, в 13 строке – Ф.И.О. испытуемого, набравшего наименьшее количество баллов по тесту; в первом столбце находится номер наиболее легкого задания, то есть задания, на которое большинство испытуемых ответило правильно, в 10 столбце – наиболее трудное задание.

После упорядочивания результатов ответов испытуемых на задания в тестовой форме таким образом, как это продемонстрировано в рамках матрицы тестовых результатов (таблица 1), составляется корреляционная матрица, в рамках которой определяется корреляция каждого задания с баллами по всему тесту (то есть выявление системной функции задания) – таблица 2 [4].  

Таблица 2 - Корреляционная матрица по заданию №7 [4]

Испытуемые

X7

Y

X7Y

X2

Y2

1.

1

9

9

1

81

2.

1

8

8

1

64

3.

1

7

7

1

49

4.

0

6

0

0

36

5.

0

6

0

0

36

6.

1

5

5

1

25

7.

1

5

5

1

25

8.

0

5

0

0

25

9.

0

4

0

0

16

10.

0

4

0

0

16

11.

0

3

0

0

9

12.

0

2

0

0

4

13.

0

1

0

0

1

5

65

34

5

387

 

Обозначения, используемые в корреляционной матрице по заданию №7:

X7 – количество баллов каждого испытуемого по заданию №7;

- сумма;

Y – количество баллов за тест определенного испытуемого;

X7Y – произведение количества баллов каждого испытуемого по заданию №7;

X2 – количество баллов каждого испытуемого по заданию №7, возведенное в квадрат;

Y2 – количество баллов за тест определенного испытуемого, возведенное в квадрат.

После построения второй (в нашем случае учебной) матрицы В.С. Аванесов предлагает для проверки системности задания произвести нижеследующие расчеты по 4 формулам [4]:

1)                         SS7 =  - ,

где SS7 – это «сумма квадратов отклонений баллов испытуемых от среднего арифметического балла в интересующем задании» [4].

2)                         SSу =  = 387 -  = 62,

где SSy – это «сумма квадратов отклонений тестовых баллов испытуемых от среднего арифметического балла по всему тесту» [4].

3)                         SPxy =  -  34 - 9,

где SPxy – это «скорректированная на средние значения сумма попарных произведений X и Y» [4].

4)                         rxy  = = ,

где rxy – это «коэффициент корреляции» [4].

Для того, чтобы задание в тестовой форме можно было назвать тестовым необходимо, чтобы его коэффициент корреляции - rxy был не ниже, чем 0,3. Задания в тестовой форме, чей коэффициент корреляции < 0,3, не является системным. Такие задания не включаются в тест, равно как и задания, не имеющие дифференцирующей способности.

Существуют и другие способы статистической обработки результатов тестирования по заданиям в тестовой форме, которые подробно представлены в статье В.С. Аванесова «Проблема качества педагогических измерений» [5]. Свои расчеты по определению коэффициента корреляции можно, например, проверить, воспользовавшись формулой для подсчета бисерального коэффициента, предложенной Дж. Гласс и Дж. Стэнли [8, с.150].

Произведя все расчеты и отобрав, таким образом, задания в тестовой форме, которые могут быть названы тестовыми, мы перешли к наивысшей ступени педагогических измерений в теории В.С. Аванесова, а именно – собственно к понятию «тест», под которым понимается «педагогическая система заданий специфической формы, РАВНОМЕРНО ВОЗРАСТАЮЩЕЙ ТРУДНОСТИ (выделено нами), позволяющая качественно оценить структуру и измерить уровень подготовленности» [4]. То есть тестом можно назвать тестовые задания (которые мы отобрали в ходе статистико-математической обработки), расположенные, начиная с самого легкого задания, на которое большинство испытуемых ответило правильно, до самого сложного тестового задания.

Учитывая вышеизложенное, можно констатировать, что бόльшая часть используемых в педагогической практике «тестов» таковыми не являются и не могут служить средством объективной оценки знаний испытуемых, что интуитивно осознается огромным количеством критиков тестирования. Тем не менее, правильно разработанные тесты с учетом изложенных нами методологических положений могут служить незаменимой формой контроля и самоконтроля, а также обучения и самообучения.

 

Literature:

1.     Berk, R.A. A Guide to Criterion-Referenced Test Construction. – Baltimore: The John Hopkins Univ. Press. – 1984. – 347 p.

2.     Kingsbury, G.G., Zara, A.R. A comparison of procedures for content – sensitive item selection in computerized adaptive tests //Applied Measurement in Education. – 1991. – №4. – P. 241-261.

3.     Аванесов В.С. Методологические и теоретические основы тестового педагогического контроля: автореф. … д-ра пед. наук: 13.00.01. – СПб, 1994. – 32 с.

4.     Аванесов В.С. Научные основы тестового контроля знаний. – М.: Исследовательский Центр, 1994. – 135 с.

5.     Аванесов В.С. Проблема качества педагогических измерений //Педагогические измерения. – 2004. - №2. – С. 3-31.

6.     Беспалько В.П. Педагогика и прогрессивные технологии обучения. – М., 1995. – 336 с.

7.     Блок О.Г. Учебно-методическое пособие по составлению тестовых заданий для оперативной оценки знаний студентов (на примере дисциплины «Психодиагностика»). – Караганды: Изд-во КарГУ, 2002. – 78 с.

8.     Гласс, Дж., Стэнли, Дж. Статистические методы в педагогике и психологии. – М.: Прогресс, 1976. – 496 с.

9.     Кулмагамбетов И.Р. Тестовый контроль в медицинском ВУЗе: методические рекомендации /И.Р. Кулмагамбетов, Р.С. Досмагамбетова, Н.С. Умбеталина, Е.М. Тургунов. – Караганда, 2001. – 36 с.

10.                       Поддубный А.В. Методические основы педагогического тестирования: учебное пособие /А.В. Поддубный, И.К. Панина, Л.Я. Ащепкова. – Владивосток: Изд-во Дальневосточного ун-та, 2003. – 119 с.

11.                       Приказ МОН РК №125 от 18.03.2008 «Об утверждении Типовых правил проведения текущего контроля успеваемости, промежуточной и итоговой аттестации обучающихся». – Астана, 2008. – 34 с.

12.                       Словарь русского языка (в четырех томах) /под ред. А.П. Евгеньевой. – М.: Русский язык, 1986. – Т. 2. – 736 с.