Диагностика и оценка учебных достижений обучающихся. П.1.3.5. Современные методы диагностирования достижений обучающихся и воспитанников в образовательном процессе. Основные параметры достижений обучающихся в сфере дополнительного образования

Для диагностики успешности обучения в школе разрабатываются специальные методы, которые разными авторами называются тестами учебных достижений, тестами успешности, дидактическими тестами и даже тестами учителя (под последними могут также подразумеваться тесты, предназначенные для диагностики профессиональных качеств педагогов, либо малоформализованные диагностические средства, которые может использовать учитель, такие, как наблюдение, беседа и др.).

Как отмечает американский психолог А. Анас-тази, по численности этот тип тестов занимает первое место.

Тесты достижений предназначены для того, чтобы оценить успешность овладения конкретными знаниями и даже отдельными разделами учебных дисциплин, и являются более объективным показателем обученности школьника, чем отметка. Последняя зачастую становится не только оценкой знаний учащегося, но и инструментом воздействия на него, может выражать отношение учителя к степени его дисциплинированности, организованности, особенностям поведения и т.д. Тесты достижений лишены этих недостатков, разумеется, при условии грамотного их составления и применения.

Тесты достижений отличаются от собственно психологических тестов (способностей, интеллекта). Их отличие от тестов способностей состоит, во-первых, в том, что с их помощью изучают успешность овладения конкретным, ограниченным определенными рамками учебным материалом, например разделом математики "Стереометрия" или курсом английского языка. На формирование способностей (например, пространственных) обучение также будет оказывать влияние, но оно не является единственным фактором, определяющим уровень их развития. Поэтому при диагностике способностей трудно найти однозначное объяснение высокой или низкой степени их развитости у школьника. Во-вторых, различие между тестами определяется

целями их применения. Тесты способностей направлены главным образом на выявление предпосылок к тем или иным видам деятельности и претендуют на прогнозирование выбора для индивида наиболее подходящей профессии или профиля обучения. Тесты же достижений применяются для оценки успешности овладения конкретными знаниями, с целью определения эффективности программ, учебников и методов обучения, особенностей работы отдельных учителей, педагогических коллективов, т.е. диагностируют прошлый опыт, результат усвоения тех или иных дисциплин или их разделов. Хотя нельзя отрицать того факта, что тесты достижений также могут в определенной степени предсказывать темпы продвижения учащегося в той или иной учебной дисциплине, поскольку имеющийся на момент тестирования высокий или невысокий уровень овладения знаниями не может не отразиться на дальнейшем процессе обучения. Указывая на разницу в обсуждаемых типах тестов, А. Анастази отмечает, что она наиболее выпукло выступает при оценке их валидности: "Лучший способ оценить тесты способностей - это осуществить прогностическую критериально-ориентированную валидизацию, тогда как тесты достижений в основном оцениваются в терминах валидности по содержанию" (А. Анастази, 1982. Т. 2. С. 37).

Тесты достижений отличаются также и от тестов интеллекта Последние направлены не на диагностику конкретных знаний или фактов, а требуют от учащегося умения совершать с понятиями (пусть даже и учебными) определенные умственные действия, такие, как проведение аналогии, классификации, обобщение и др.

Это отражено и в формулировании конкретных заданий тестов того и другого типа. Например, тест достижений на материале истории определенного периода может содержать такие вопросы:

Заполни пропуски в предложениях:

Вторая мировая война началась в... году, а) 1945; б) 1941; в) 1939; г) 1935. 22 июля 1941 года фашисты напали на... а) Польшу; б) Советский Союз; в) Францию; г) Венгрию. В тесте же умственного развития вопросы с использованием понятий из истории будут иметь следующий вид:

Вам даны пять слов. Четыре из них объединены общим признаком, пятое слово к ним не подходит. Его надо найти и подчеркнуть, а) товар; б) город; в) ярмарка; г) натуральное хозяйство; д) деньги, а) рабовладелец; б) раб; в) крестьянин; г) рабочий; д) ремесленник. Для того чтобы правильно ответить на вопросы, входящие в тест достижений, необходимы знания конкретных фактов, дат и др. Старательный ученик, обладающий хорошей памятью, без труда может найти правильные ответы в заданиях теста достижений. Однако если у него плохо сформированы умения работать с понятиями, анализировать их, находить существенные признаки, то задания теста интеллекта могут вызвать значительные затруднения (поскольку для их выполнения только хорошей памяти недостаточно) Необходимо владение целым рядом мыслительных операций, знание тех понятий, на материале которых составлены задания теста.

Наряду с тестами достижений, предназначенными для оценки усвоения знаний по конкретным дисциплинам или их циклам, в психологии разрабатываются и более широко ориентированные тесты Это, например, тесты на оценку отдельных навыков, требующихся школьнику на разных этапах обучения, таких, как некоторые общие принципы решения математических задач, анализа литературных текстов и др. Еще

более широко ориентированными являются тесты для изучения умений, которые могут пригодиться при овладении рядом дисциплин, например навыки работы с учебником, математическими таблицами, географическими картами, энциклопедиями и словарями. И наконец, существуют тесты, направленные на оценку влияния обучения на формирование логического мышления, способности рассуждать, строить выводы на основе анализа определенного круга данных и т.д. Эти тесты в наибольшей степени приближаются по своему содержанию к тестам интеллекта и высоко коррелируют с последними. Поскольку тесты достижений предназначены для оценки эффективности обучения по конкретным предметам, то обязательным участником формулирования отдельных заданий должен стать учитель. Психолог же обязан обеспечить соблюдение всех формальных процедур, требуемых для создания надежного и валидного инструмента, с помощью которого можно было бы осуществлять диагностику и проводить сопоставления по исследуемым качествам отдельных учащихся или их групп (классов, школ, регионов и т.д.).

Отдельные тесты достижений можно объединять в батареи, что позволяет получать профили показателей успешности обучения по разным школьным предметам. Как правило, тестовые батареи предназначены для разных образовательно-возрастных уровней и не всегда дают результаты, которые можно сопоставлять друг с другом для получения целостной картины успешности обучения от класса к классу. Наряду с ними созданы батареи, которые позволяют получать такие данные. Это, например, тесты основных навыков (штата Айова) и успехов в обучении, тесты достижений и тесты учебных навыков Стэнфордского университета и др

Рассмотрим в качестве примера Стэнфордский тест достижений (SAT), краткое описание которого приведено в книге А. Анастази (1982. Т. 2.). Разработанный в 1923 г., он неоднократно перерабатывался

Блоки батареи могут использоваться самостоятельно, 1 эффективности обучения по отдельным дисциплинам. Вот, например, какие субтесты входят в батарею SAT, предназначенную для детей 5 и 6 классов (с середины 5-го до окончания 6-го).

1. Словарь: изучает словарный запас с помощью устного предъявления незавершенных предложений с просьбой к ребенку выбрать из данных на выбор наиболее подходящее слово. Например: человек, который большую часть времени находится в плохом настроении, называется:

а) отшельник; б) актер; в) брюзга; д) учащийся. 2.

Понимание прочитанного: ребенка просят прочитать отрывок из прозы или стихотворения и к каждому задают серию вопросов. Для того чтобы дать правильные ответы, учащийся должен уметь выделять главную мысль отрывка, ключевые моменты текста, понимать его скрытый смысл, уметь делать выводы из прочитанного. 3.

Навыки анализа слов: ученик должен произнести зрительно предъявляемые ему отдельные буквы и их сочетания, составить слова из слогов. 4.

Математические понятия: изучает понимание математических терминов и систем обозначений и действий, например дробей, множеств, процентов и т д 5.

Математические вычисления: включает оценку умений действовать с числами (буквенные обозначения не используются). 6.

Применение математики: содержит типичные арифметические задачи, задания на 7.

измерения и составление графиков и др. 7.

Грамотность: нахождение неправильно написанных слов. 8.

Язык: требуется правильно использовать прописные буквы, формы глаголов и местоимений, верно строить предложения, соблюдать правила пунктуации и т.д. 9.

Социальные науки: требуется выполнение заданий на основе знаний из области истории, экономики, политики, социологии и др.

10. Естественные науки: содержит задания, выявляющие знание некоторых методов и терминов из области физики и биологии.

11. Понимание прослушанного: требуется прослушать текст и ответить на ряд вопросов.

В 1973 г. SAT был стандартизирован на национальной выборке школьников с 1 по 9 классы.

В США тесты достижений получили очень широкое распространение и используются не только в школе, но и в дошкольных учреждениях и для выборок взрослых людей (например, для определения уровня грамотности тех или иных слоев населения)

Что касается дошкольников, то наиболее актуальной задачей является определение готовности ребенка к обучению в школе. Готовность к школе обычно определяется по ряду параметров- по уровню овладения знаниями, развитию некоторых способностей, сформированности учебной мотивации, выраженности произвольности и др. Учитывается и сенсомоторное развитие дошкольника, его физическое, умственное развитие, умение выполнять указания взрослого. Широкую известность в США приобрела батарея, которая называется национальным тестом готовности (MRT) С его помощью диагностируется уровень овладения некоторыми важными для дальнейшего обучения понятиями (языковыми и количественными), такими, как умение выделять разные звуки, находить последовательность событий (в картинках).

В других тестах диагностируется уровень осведомленности ребенка в окружающем мире, овладение языком и основами математических понятий, понимание на слух. Некоторые психологи указывают на недостаточность изучения в основном интеллектуальной сферы и призывают больше внимания уделять изучению особенностей поведения ребенка.

Достаточно популярными в нашей стране являются тесты школьной зрелости Я. Йирасека и программа диагностики психологической готовности к школе, предложенная Н.И. Гуткиной (Н И Гуткина, 1993)

При составлении заданий теста достижений следует соблюдать ряд правил, которые позволят создать надежный, сбалансированный инструмент оценки успешности овладения определенными учебными дисциплинами или их разделами. Так, например, необходимо проанализировать содержание заданий с позиций равной представленное™ в тесте разных учебных тем, понятий, действий и т д. Тест не должен быть перегружен второстепенными терминами, несущественными деталями и не должен делать упор на механическую память, которая может быть задействована, если в тест включать точные формулировки из учебника или фрагменты из него. Задания теста должны быть сформулированы четко, кратко и недвусмысленно, чтобы все учащиеся однозначно

понимали смысл вопроса. Важно проследить, чтобы ни одно задание теста не могло служить подсказкой для ответа на другое.

Варианты ответов на каждое задание должны подбираться таким образом, чтобы исключались возможности простой догадки или отбрасывания заведомо неподходящего ответа.

Важно выбирать и наиболее приемлемую форму ответов на задания. Учитывая, что задаваемый вопрос должен быть сформулирован коротко, желательно также кратко и однозначно формулировать ответы. Например, удобна альтернативная форма ответов, когда учащийся должен подчеркнуть одно из перечисленных решений: "да"- "нет", "верно"-"неверно". Часто при составлении заданий в нем делаются пропуски, которые должен заполнить испытуемый, выбирая из представленного набора ответов верный (выше мы приводили пример задания из теста достижений с такой формой ответов). Обычно на выбор предлагается 4-5 вариантов ответа. Как и любой тест, этот вид должен удовлетворять всем необходимым критериям, обладать высокой надежностью и удовлетворительной валидностью.

Для диагностики успешности обучения в школе разрабатываются специальные методы, которые разными авторами называются тестами учебных достижений, тестами успешности, дидактическими тестами и даже тестами учителя (под последними могут также подразумеваться тесты, предназначенные для диагностики профессиональных качеств педагогов либо малоформализованные диагностические средства, которые может использовать учитель, такие как наблюдение, беседа и др.)- Как отмечает американский психолог А. Анастази, по численности этот тип тестов занимает первое место.

Тесты достижений предназначены для того, чтобы оценить успешность овладения конкретными знаниями и даже отдельными разделами учебных дисциплин и являются более объективным показателем обученности школьника, чем отметка. Последняя зачастую становится не только оценкой знаний учащегося, но и инструментом воздействия на него,

может выражать отношение учителя к степени его дисциплинированности, организованности, особенностям поведения и т. д. Тесты достижений лишены этих недостатков, разумеется при условии грамотного их составлении и применения.

Тесты достижений отличаются от собственно психологических тестов (способностей, интеллекта). Их отличие от тестов способностей состоит, во-первых, в том, что с их помощью изучают успешность овладения конкретным, ограниченным определенными рамками учебным материалом, например, разделом математики «стереометрия» или курсом английского языка. На формирование способностей (например, пространственных) влияние обучения также будет сказываться, но оно не является единственным фактором, определяющим уровень их развития. Поэтому при диагностике способностей трудно найти однозначное объяснение высокой или низкой степени их развитости у школьника. Во-вторых, различие между тестами определяется целями их применения. Тесты способностей направлены главным образом на выявление предпосылок к тем или иным видам деятельности и претендуют на прогнозирование выбора для индивида наиболее подходящей профессии или профиля обучения- Тесты же достижений применяются для оценки успешности овладения конкретными знаниями с целью определения эффективности программ, учебников и методов обучения, особенностей работы отдельных учителей, педагогических коллективов и т. д., то есть диагностируют прошлый опыт, результат усвоения тех или иных дисциплин или их разделов. Хотя нельзя отрицать того факта, что тесты достижений также могут в определенной степени предсказывать темпы продвижения учащегося в той или иной учебной дисциплине, поскольку имеющийся на момент тестирования высокий или невысокий уровень овладения знаниями не может не

Основы психодиагностики

отразиться на дальнейшем процессе обучения. Указывая на разницу в обсуждаемых типах тестов, А. Анастази отмечает, что она наиболее выпукло выступает при оценке их валидности: «Лучший способ оценить тесты способностей - это осуществить прогностическую критериально-ориентированную вали-дизацию, тогда как тесты достижений в основном оцениваются в терминах валидности по содержанию» (А. Анастази, 1982, т.2, с. 37).

Тесты достижений отличаются также и от тестов интеллекта. Последние направлены не на диагностику конкретных знаний или фактов, а требуют от учащегося умения совершать с понятиями (пусть даже и учебными) определенные умственные действия, такие как аналогий, классификации, обобщение и др. Это отражено и в формулировании конкретных заданий тестов того и другого типа. Например, тест достижений на материале истории определенного периода может содержать такие вопросы:

«Заполни пропуски в предложениях:

Вторая мировая война началась в........ году.

а) Польшу

б) Советский Союз

в) Францию

г) Венгрию».

В тесте же умственного развития вопросы с использованием понятий из истории будут иметь следующий вид:

«Вам даны пять слов. Четыре из них объединены общим признаком, пятое слово к ним не подходит. Его надо найти и подчеркнуть.

а) товар б) город в) ярмарка г)"натуральное хозяйство д) деньги

а) рабовладелец б) раб в) крестьянин г) рабочий д) ремесленник».

Для того, чтобы правильно ответить на вопросы, входящие в тест достижений, необходимы знания конкретных фактов, дат и др. Старательный ученик, обладающий хорошей памятью, без труда может найти правильные ответы в заданиях большинства тестов достижений. Однако, если у него плохо сформированы умения работать с понятиями, анализировать их, находить существенные признаки и т. д., то задания теста интеллекта могут вызвать значительные затруднения (поскольку для их выполнения одной хорошей памяти недостаточно). Необходимо владение целым рядом мыслительных операций, знание тех понятий, на материале которых составлены задания теста.

[Примечание редактора. В разделе 3.7 даются примеры того, как избежать буквальной зависимости успешности в тестах достижений от уровня развития «механической» памяти и основанного на ней поверхностно-ассоциативного мышления, как разрабатывать задания, требующие обнаружить понимание внутрипредметнои логики, т. е. концептуальное освоение материала.]

Наряду с тестами достижений, предназначенными для оценки усвоения знаний по конкретным дисциплинам или их циклам, в психологии разрабатываются и более широко ориентированные тесты. Это, например, тесты на оценку отдельных навыков, требующихся школьнику на разных этапах обуче-

Основы психодиагностики _____ "

ния, таких как некоторые общие принципы решения математических задач, анализа литературных текстов и др. Еще более широко ориентированными являются тесты для изучения умений, которые могут пригодиться при овладении рядом дисциплин, например, навыки работы с учебником, математическими таблицами, географическими картами, энциклопедиями и словарями. И, наконец, существуют тесты, направленные на оценку влияния обучения на формирование логического мышления, способности рассуждать, строить выводы на основе анализа определенного круга данных и т. д. Эти тесты в наибольшей степени приближаются по своему содержанию к тестам интеллекта и высоко коррелируют с последними. Поскольку тесты достижений предназначены для оценки эффективности обучения по конкретным предметам, то обязательным участником формулирования отдельных заданий должен стать учитель. Психолог же обязан обеспечить соблюдение всех формальных процедур, требуемых для создания надежного и валидного инструмента, с помощью которого можно было бы осуществлять диагностику и проводить сопоставления по исследуемым качествам отдельных учащихся или их групп (классов, школ, регионов и т. д.). То есть психолог должен выполнить роль методиста-тестолога.

Отдельные тесты достижений можно объединять в батареи, что позволяет получать профили показателей успешности обучения по разным школьным предметам. Как правило, тестовые батареи предназначены для разных образовательно-возрастных уровней и не всегда дают результаты, которые можно сопоставлять друг с другом для получения целостной картины успешности обучения от класса к классу. Наряду с ними созданы батареи, которые позволяют получать такие данные. Это, например, тесты основных навыков (штата Айова) и успехов в обуче-

Практические задачи школьной психодиагностики

нии, тесты достижений и тесты учебных навыков Стэнфордского университета и др.

Рассмотрим в качестве примера Стэнфордский тест достижений (SAT), краткое описание которого приведено в книге А. Анастази (А. Анастази, 1982 г., т.2, с.42-43). Разработанный в 1923 г., он неоднократно перерабатывался, и последний вариант появился в 1973 г. Проведение всей батареи занимает 4-5 часов и осуществляется в несколько приемов- Некоторые блоки батареи могут использоваться самостоятельно, для оценки эффективности обучения по отдельным дисциплинам. Вот, например, какие субтесты входят в батарею SAT, предназначенную.для детей 5 и 6-х классов (с середины 5-го до окончания 6-го):

1. Словарь: изучает словарный запас с помощью устного предъявления незавершенных предложений с просьбой к ребенку выбрать наиболее подходящее слово. Например, «Человек, который большую часть времени находится в плохом настроении, называется: а) отшельник б) актер в) брюзга д) учащийся»..

2. Понимание прочитанного: ребенка просят прочитать отрывок прозы или стихотворения и к каждому задают серию вопросов. Для того, чтобы дать правильные ответы, учащийся должен уметь выделить главную мысль отрывка, ключевые моменты текста, понимать его скрытый смысл, уметь делать выводы из прочитанного.

3. Навыки анализа слов: ученик должен произнести зрительно предъявляемые ему отдельные буквы и их сочетания, составить слова из слогов.

4. Математические понятия: изучает понимание математических терминов и систем обозначений и действий, например, дробей, множеств, процентов и

5. Математические вычисления: включает оценку умений действовать с числами (буквенные обоз-

Основы психодиагностики

начения не используются).

6. Применение математики: содержит типичные арифметические задачи, задания на измерения и составление графиков и др.

7. Грамотность: нахождение неправильно написанных слов.

8. Язык: требуется правильно использовать прописные буквы, формы глаголов и местоимений, верно строить предложения, соблюдать правила пунктуации и т. д.

9. Социальные науки: требуется выполнение заданий на основе знаний из области истории, экономики, политики, социологии и др.

10. Естественные науки: задания выявляют знания некоторых методов и терминов из области физики и биологии.

11. Понимание прослушанного: требуется прослушать текст и ответить на ряд вопросов.

В 1973 году SAT был стандартизован на национальной выборке школьников с 1-го по 9-й классы.

Следует отметить, что в США тесты достижений получили очень широкое распространение и используются не только в школе, но и в дошкольных учреждениях и для выборок взрослых людей (например, для определения уровня грамотности тех или иных слоев населения).

Что касается дошкольников, то наиболее актуальной задачей является определение готовности ребенка к обучению в школе. Здесь также широко могут использоваться тесты достижений (о других тестах, используемых в диагностике готовности к школе, см. 3.2). Широкую известность в США приобрела батарея, которая называется национальным тестом готовности (MRT). С его помощью диагностируется уровень овладения некоторыми важными для дальнейшего обучения понятиями (языковыми и

Практические задачи школьной психодиагностики

количественными), такими как умение выделять разные звуки, находить последовательность событий (в картинках). В других тестах диагностируется уровень осведомленности ребенка в окружающем мире, овладение языком и основами математических понятий, понимание на слух.

При составлении заданий теста достижений следует соблюдать ряд правил, которые позволяют создать надежный, сбалансированный инструмент оценки успешности овладения определенными учебными дисциплинами или их разделами (см. 3.7).

Ключевые термины: умственное развитие, тесты интеллекта, тесты достижений, социально-психологический норматив, качественный анализ, компьютерные тесты, осведомленность , аналогии, обобщение, классификация, числовые ряды.

ТЕСТ ОБЩЕОБРАЗОВАТЕЛЬНЫХ ЗНАНИЙ: КОМПЬЮТЕРНОЕ АДАПТИВНОЕ ТЕСТИРОВАНИЕ

В отличие от предметно ориентированных тестов умственного развития (ТУР), описанных в предыдущей главе, в настоящей главе излагаются принципы создания Теста Общеобразовательных Знаний (ТОЗ). Если в различных вариантах ТУРа шкалы отражают прежде всего уровень сформированности определенных логических операций мышления, реализованных на материале понятий из школьных учебников (аналогии, обобщение и т. п.), то любые версии ТОЗ отражают в показателях по субшкалам достижения ученика по самим пред-

ОСНОВЫ ПСИХОДИАГНОСТИКИ

мотам школьной программы (математика, физика и

т. п.). Моли ТУР......междисциплинарный поихолого-

педагогический инструмент» то ТОЗ чисто педагогический инструмент, то есть педагогический тест достижений. Примеры-образцы отдельных заданий ТОЗ даются в параграфе «4.7.

Разработка ТОЗ для российской школы означает создание российского аналога SAT (Стоифордокий тест достижений или, как позднее его стали называть, - Школьный тест достижений), который, как известно, является в (ЛИЛ определенным стандартом федерального масштаба. Только наличие общефедераль-НОГО стандарта позволит обеспечить в России реальную эквивалентность аттестатов Зрелости, выяснить, в частности, объективную цепу невиданному количеству «медалистов», которые вдруг начинают

появляться в какой-нибудь рядовой и мало чем знаменитой школе где-нибудь в городе N-оке.

Программа создания и распространения российского ТОЗ должна, безусловно, учитывать как мировой опыт, так и специфику современной ситуации в России. Критики справедливо возражают: организационные решения, что стандартны для Запада в России могут не сработать из-за повиданного уровня «групповой сплоченности* (а попросту коррупции), имеющей место во всех слоях общества» в том числе; среди чиновников и учителей, занятых в системе образования.

Но и технологические возможности разработчиков тестовых методик не стоят на месте, Новые возможности, и прежде всего в плане обеспечения

информационной безопасности, дает компьютеризация.

Опишем здесь опыт решения проблемы создания ТОЗ, который накоплен в центре компьютерной психодиагностики «Гуманитарные технологии* при факультете психологии МГУ (руководитель центра -

Практический задачи школьной психодиагностики

А. Г. Шмелев). Данный материал поможет читателям не только сориентироваться в самой проблеме создания ТОЗ, но и получить опыт знакомства с кратким и типичным научным отчетом о проведении экспериментальной апробации некоторого теста в процессе его разработки, а также с перспективами использования компьютеров в процессе тестирования.

В отличие от Стэнфордского теста ТОЗ в своих субшкалах буквально повторяет названия учебных предметов и в этом смысле является формализованным компьютеризированным аналогом школьных выпускных и вузовских вступительных экзаменов.

С самого начала ТОЗ разрабатывается как принципиально компьютерный тест. Важнейшие его особенности таковы: наличие очень широкого компьютерного БАНКА ЗАДАНИЙ (длинного перечня) по каждому предмету и наличие особой программы ТЕСТОВОГО ДИАЛОГА, которая позволяет предъявлять каждому испытуемому по сути дела уникальную выборку заданий (вариант) из этого банка заданий. Далее сами авторы ТОЗ не знают, какие именно задания предъявит компьютер данному конкретному испытуемому. Если же кто-то получит доступ к тексту заданий ТОЗ, и расшифрует их кодировку, то для того, чтобы «обмануть» ТОЗ необходимо выучить не только правильные ответы к сотням заданий, но и научиться их отличать от ложных формулировок. Легче выучить стройно и логично написанный учебник, чем заниматься этой работой.

В первую версию ТОЗ, прошедшую апробацию на абитуриентах МГУ в 1995 году, вошло 360 заданий - по 45 заданий на каждый из 8 основных предметов школьной программы. Это математика, русский и литература, физика, химия, биология, история, география и иностранный язык (английский). В каждом задании испытуемому предлагалось 4 вари-

Основы психодиагностики

анта ответов, из которых 1 - правильный. В ра#!Р ботке заданий приняли участие независимые (не 31*** шие друг друга) учителя-предметники из московс*^**"^ школ и преподаватели МГУ, много лет участво***" 1 шие в составлении и проверке заданий на встуГ* и ~ тельных экзаменах. Задания проходили анонимйУ 10 перекрестную предварительную экспертизу, и за** вМ лучшие из заданий были разбиты на однород*£* ,1е блоки по тематике и уровню сложности. По сод^Р" жанию йадания охватывают всю программу среди:с*** 0 образования и ориентированы на выпускников шк^- 71 " абитуриентов вузов.

Испытуемый выполняет ТОЗ непосредственно ** а компьютером. Программа тестирования (ТЕСТАН-^" «Гуманитарные технологии», 1995) последователь-** 0 предъявляет вначале 15 заданий по математике, заТ® м 15 - по русскому и литературе и т. д. - всего 1 320 заданий за 80 минут. Компьютер автоматические** контролирует расход времени на каждый предмет* ** при исчерпании лимита времени по одному предг/г**-ту программа начинает предъявлять задания по следующему предмету, засчитывая «пропуск» испытуемому по всем заданиям, на которые он не усгтол ответить (из предусмотренных 15).

По каждому предмету 15 заданий представляют

пять тематических блоков и 3 уровня сложности -Применяется алгоритм БЛОЧНОЙ РАНДОМИЗАЦИИ, т. е. частично случайного выбора заданий, ограниченного рамками блоков - определенных подмножеств заданий, среди которых каждый р«з производится случайный выбор. Вначале предъявлю!-ются 5 самых легких заданий, затем 5 заданий среднего уровня трудности, затем - 5 самых трудимся заданий. В результате даже плохо подготовленные и испытывающие волнение испытуемые получают возможность с самого начала «зацепиться», справитьо-яс по крайней мере с первыми простыми заданиям:**.

Практический задачи школьной психодиагностики

Сильные испытуемые получают серьезное испытание на последней пятерке заданий. Здесь-то и проявляется различие между настоящими отличниками и «хорошистами». Самые слабые, как правило, просто не успевают приступить к пятерке самых трудных заданий, так как им не хватает времени.

Реальная трудность задания проверялась в пилотажном эксперименте и после этого корректировалась. В число легких попадали задания, с которыми справлялись более 70 процентов испытуемых, в числе трудных - с которыми справлялись менее 30 процентов испытуемых, остальные причислялись к средним по уровню трудности.

Схема начисления очков в ТОЗ-1 при расчете суммарного балла такова:

за правильный ответ - 4 очка,

за пропуск задания - 1 очко,

за ошибочный ответ - 0 очков.

Такая схема вносит необходимую поправку на вероятность случайных правильных ответов, которые по теории вероятности возможны с вероятностью 0,25.

После завершения такого нелегкого испытания испытуемые могли вспомнить только 10, максимум 25 процентов из предъявленных им заданий, но, конечно, не могли пересказать своим друзьям точные формулировки фальш-альтернатив (ложных ответов, или так называемых «дистракторов»). И если теоретическая вероятность повторения одного и того же задания у двух испытуемых равнялась 0,33-15 ~ 5 заданиям, то практически крайне редко два испытуемых могли вспомнить больше одного одинакового задания. Даже после интенсивного обсуждения впечатлений от теста между собой у испытуемых оставалось полное впечатление, что тест включает сотни заданий по одному предмету. Естественно, что при дальнейшем наращивании банка заданий в ТОЗ-2 та-

Основы психодиагностики

кое впечатление будет еще более усиливаться.

ТОЗ-1 имеет ряд модификаций для специальных групп абитуриентов- Например, версия ТОЗ-ПСИ (для абитуриентов психологического факультета) включала по 90 заданий всего по 3 предметам, входящим в состав вступительных экзаменов на факультет психологии МГУ: математика, русский и литература, биология. Каждый абитуриент отвечал за 50 минут на 90 заданий (по 30 на каждый предмет).

На этих абитуриентах факультета психологии проверялась, в частности, прогностическая валидность ТОЗ в отношении успешности сдачи вступительных экзаменов. Общая корреляция суммарного балла ТОЗ с суммарным баллом по вступительным экзаменам оказалась равной 0,61. При этом почти такое же значение достигла эта корреляция для субтеста «математика» (0,57). А вот с оценкой по сочинению балл по субтесту «словесность» коррелировал просто плохо. Сказалось, видимо, два обстоятельства: слабые представления абитуриентов о том, что такое «раскрыть тему», и высокая степень лотерейности в вариантах формулировок этих тем (вполне грамотным и в целом начитанным абитуриентам приходилось писать сочинения по авторам и произведениям, которых они либо никогда не читали, либо забывали и не успели повторить). Таким образом, невысокую суммарную корреляцию можно интерпретировать, в частности, как следствие низкой надежности не столько ТОЗ, сколько самого критерия - ведь элемент случайности на вступительных экзаменах выражен даже сильнее, чем в ТОЗ. За это говорит и факт резкого возрастания корреляции с результатами экзаменов для крайних групп по ТОЗ (самых успешных и самых неуспешных). Так, например, НИ ОДИН испытуемый с баллом ниже 50 процентов правильных ответов по ТОЗ не смог пройти на факультет психологии МГУ по конкурсу (конкурс был, как

Практические задачи школьной психодиагностики

всегда, высоким - выше 7 человек на место). А самые лучшие абитуриенты по ТОЗ практически все успешно прошли конкурс.

Таким образом, на шкале ТОЗ можно найти граничные точки для «высшей» и «низшей» группы, позволяющие прогнозировать успешность при сдаче экзаменов с высокой степенью надежности - близкой к 0,95. Можно сказать, что для заведомо сильных и заведомо слабых учащихся будущие экзамены не оказываются «лотереей»: одни надежно их сдают, другие - надежно «проваливают». «Лотереей» с элементом везения-невезения экзамен становится для «середнячков», которые освоили учебную программу выборочно, частично.

Вопрос о «конкурентной валидности» ТОЗ по сравнению с вступительными экзаменами (т. е. позволяет ли ТОЗ лучше или хуже прогнозировать успешность обучения в вузе) может быть разрешен только после многолетнего, так называемого «лонги-тюдного» наблюдения за тем, как будут учиться в вузе студенты, прошедшие ТОЗ в 1995 году.

Конечно, версия ТОЗЛ есть только первый шаг к созданию.эталонной методики такого типа. Она нуждается в существенной модернизации, масштабной апробации и накоплению репрезентативных норм, чтобы занять место федерального стандарта в данной области.

Адаптивное тестирование

Планируемая версия ТОЗ-2 должна включать уже не менее 200-300 заданий по каждому предмету, а также опираться на более совершенный программный алгоритм, использующий принципы так называемого АДАПТИВНОГО ТЕСТИРОВАНИЯ.

Адаптивным тестированием называется такая

Основы психодиагностики

диалоговая тестовая программа, которая изменяет порядок предъявления тестовых заданий в зависимости от результатов выполнения испытуемым уже предъявленных заданий. Когда опытный экзаменатор проводит устный экзамен, он фактически всегда применяет некий упрощенный интуитивный вариант адаптивного тестирования. После первых удачных ответов экзаменующегося экзаменатор старается задать вопрос посложнее, и если учащийся справляется и с этим сложным вопросом, то экзаменатор, вполне,справедливо экономя свое собственное время, ставит учащемуся оценку «5». После первых же ошибочных ответов экзаменатор, наоборот, «снижает планку» - задает самый простой вопрос, и если учащийся не справляется и с этим простейшим вопросом, то экзаменатор ставит учащемуся оценку «2». Таким образом, для выявления крайних случаев требуется гораздо меньше тестовых заданий при обеспечении практически того же уровня надежности. Дольше времени надо потратить и большее количество вопросов задать в случае «середнячков», которые с одними заданиями справляются, а с другими нет, так как освоили учебную программу не полностью. Смысл адаптивности в алгоритме тестирования в том, что тест адаптируется, настраивается на доступный испытуемому уровень сложности и тем самым быстрее локализует его истинный тестовый балл на шкале измеряемого свойства.

Конечно, 15 заданий по одному предмету - это мало, эта выборка заданий не обеспечивает полноценный охват всей учебной программы. Но если эти задания различаются по сложности хотя бы на 3 уровня, то возникает возможность для применения следующего упрощенного (и потому понятного начинающим) адаптивного алгоритма. После первой пятерки самых простых заданий программа сразу же подсчитывает процент правильных ответов. Если

Практические задачи школьной психодиагностики

решены все 5 заданий, то программа сразу переводит испытуемого на самый высокий уровень трудности- Если решены от 2 до 4 заданий, то программа переводит испытуемого на средний уровень трудности. В противном случае испытуемый остается на первом уровне трудности. На втором этапе программа применяет аналогичную логику. С теми, кто справился с 4-5 заданиями высшего уровня трудности, тестирование можно прекращать и ставить балл, учитывающий общий процент решенных задач с учетом их цены (более трудные имеют, конечно, более высокую цену). Если же на высшем уровне трудности испытуемый допустил более одной ошибки, то тестирование продолжается уже на среднем уровне трудности. Те испытуемые, которые долго остаются на среднем уровне, выполняют тест значительно дольше - пока колебания их текущего балла (процента правильных ответов) не стабилизируются в рамках пренебрежимо малого интервала, равного ошибке измерения.

«ТРЕХУРОВНЕВЫЙ АЛГОРИТМ», подобный описанному выше, позволяет при предъявлении в среднем 15 заданий добиваться такой же точности-надежности, как и тест со сплошным предъявлением 45 заданий, не учитывающий уровень трудности заданий. То есть, огрубленно говоря, введение трех уровней трудности и оптимального алгоритма перехода с уровня на уровень позволяет втрое сократить расходы на продолжительность тестирования.

Впрочем, выигрыш от адаптивности состоит не только в экономии времени, но и в информационной безопасности. Чем меньше заданий предъявляется одному испытуемому из банка заданий, тем менее становится «прозрачным», обозримым для испытуемых весь банк заданий.

Постепенное расширение банка заданий и создание специализированных версий ТОЗ для более млад-

Основы психодиагностики

ших классов будет создавать у детей привычку к выполнению таких процедур контроля знаний. Применение тематической блочной структуры в рамках одного предмета, наряду с адаптивными алгоритмами тестирования, не только сэкономит дорогое компьютерное время в компьютерных классах, но и позволит быстро и надежно локализовать «проблемные» зоны - провалы в усвоении материала у данного конкретного ученика.

Если тестовые задания не классифицированы по уровню сложности, то при применении компьютеров возможность для использования адаптивного тестирования в принципе сохраняется. В частности, может быть использован простейший АЛГОРИТМ «СХОДЯЩИХСЯ ПОРОГОВ». После предъявления какого-то начального набора заданий (минимально тематически представительного для данной учебной дисциплины) компьютерная программа начинает постоянно сравнивать (после каждого нового задания) текущий процент правильных ответов, показанный испытуемым, с двумя порогами - высоким порогом «зачета» и низким порога «незачета». Те испытуемые, которые хорошо овладели учебным материалом и достигли за минимальное число тестовых заданий верхнего порога (например, в 90 процентах правильных ответов), быстро получают «зачет» и освобождаются от дальнейшего тестирования. Так же быстро «освобождаются» те испытуемые, которые заведомо на выучили материал, и их ответы мало чем отличаются от случайного гадания (поначалу порог незачета может быть низким - в 40-50 процентов). Остальные испытуемые, попавшие в область неопределенности между двумя порогами, продолжают выполнение теста. С каждым новым заданиям два порога сближаются. Так что при исчерпании всех заданий, предназначенных для одного испытуемого (это не менее 40 за сеанс), каж-

Практические задами школьной психодиагностики

дый испытуемый либо попадает в группу успешных, либо в группы неуспешных (к последней относятся также те, кто не уложился с выполнением теста в отведенный временной лимит). Такая простейшая схема адаптивного тестирования обеспечивает серьезную экономию времени при проведении простейшей недифференцированной оценки уровня знаний («зачет/незачет»). Она может быть полезной и экономичной, например, в ситуации квалификационного отбора (селекции) кандидатов в группы, с которыми в дальнейшем производится более тонкая диагностика или специализированное дорогостоящее и индивидуализированное обучение.

В заключение подчеркнем, что адаптивное тестирование - такой подход к компьютерному тестированию, который фактически позволяет привнести в стандартные групповые тесты элементы индивидуализации, учета индивидуальных особенностей данного испытуемого в процессе тестирования. Границы применения адаптивного тестирования не замыкаются на проверке знаний или способностей. В принципе, подобный подход с определенными модификациями вполне применим и для тестирования сферы интересов, установок и черт личности.

Ключевые термины: тест общеобразовательных знаний (ТОЗ), банк заданий, тестовый диалог, дис-трактор, блочная рандомизация, конкурентная ва-лидность, лонгитюдное исследование, адаптивное тестирование, трехуровневый алгоритм, алгоритм сходящихся порогов.

Основы психодиагностики

I. ТЕСТЫ ДОСТИЖЕНИЙ

I.1 Диагностика учебных достижений

I.2 Тесты профессиональных достижений

ЗАКЛЮЧЕНИЕ

Список литературы

ВВЕДЕНИЕ

Тестирование (англ. test - испытание, проверка) - экспериментальный метод психодиагностики, применяемый в эмпирических социологических исследованиях, а также метод измерения и оценки различных психологических качеств и состояний индивида.

Тесты достижений не относятся к ряду психологических. Тем не менее, разработка психологических тестов во многом влияла на разработку инструментов оценки знаний и умений. К их созданию приложили руку многие видные психологи. Поэтому, психодиагностика не обходит вниманием тесты достижений, основным потребителем которых была и остается сфера образования.

О измерений в образовании в США был признан Э. Трондайк, издавший в 1903 году книгу «Образовательная психология». Публикация этой книги ознаменовала появление новой области - образовательной психологии. Э. Трондайк обсуждает принципы построения тестов и применения статистических методов в книге «Введение в теорию теорию умственных и социальных измерений». Затем один за другим появляются шкалы оценки почерка и письменных сочинений, Стандартные тесты Стоуна и Серии арифметических тестов С.А. Куртиса. Стремительному развитию тестов способствует приток в США иммигрантов, приведших к увеличению набора учащихся. Также возросла потребность в квалифицированных рабочих, что потребовало разработки методики оценки качества их обучения. В 1947 году создается Служба тестирования в образовании(ETS), со временем принявшая на себя ответственность за все программы тестирования для университетов, профессиональных училищ, правительственных учреждений и других организаций.

В дореволюционной России с начала XX века использовались и разрабатывались психологические тесты для нужд образования. В 1936г. в советской психологии под вилянием идеологических установок на применение тестов налагается запрет. Возрождение исследований происходит лишь в 1960году.

Тесты достижений используются не только в сфере образования, но и при отборе поступающих на работу в промышленность и государственные учреждения. В Китайской империи систематические экзамены при приеме на гражданскую службу были введены примерно за 150 лет до н.э. в европейских странах отбор правительственных служащих на основе экзаменов был введен в конце XVIII- начале XIX в. Комиссия гражданской службы США утвердила обязательные конкурсные экзамены в 1883г. Методы составления тестов, разработанные до и во время Первой мировой войны, были внедрены в экзаменационную программу государственной гражданской службы США в 1922г.

В настоящее время тесты достижения по численности занимают первое место среди диагностических методик.

Таким образом, мы видим, что актуальность диагностики достижений со временем только возрастает. Что явилось главной причиной выбора мной темой своей контрольной работы «Тесты достижений, область их применения».

Целью работы является выявление основных функций тестов достижения и определение областей их применения.

I. ТЕСТЫ ДОСТИЖЕНИЙ

Тест достижений – это группа психодиагностических методик, направленных на оценку достигаемого уровня развития навыков и знаний.

Выделяют 2 группы тестов достижений:

1. Тесты успешности бучения (используются в системе образования)

2. Тесты профессиональных достижений (тесты диагностики специальных знаний и трудовых навыков, необходимых для выполнения профессионально-трудовых действий).

Тест достижения противоположен тесту способностей. Различия: между этими тестами существует различие в степени единообразия предшествующего опыта, который и диагностируется. Если тест способностей отражает влияние совокупного разнообразного опыта, получаемого учащимися, то тест достижений отражает влияние относительно стандартного курса обучения чему-то.

Цель применения тестов способностей и тестов достижений:

· тесты способностей – для предсказания различия успешности выполнения деятельности

· тесты достижений – делают конечную оценку знаний и навыков по завершении обучения.

Ни тесты способностей, ни тесты достижений не диагностируют способности, навыки, одаренность, а только успешность предшествующего достижения. Идет оценка того, чему человек научился.

Классификация тестов достижений

Широкоориентированные – для оценки знаний и навыков, соответствие основным целям обучения (рассчитанным на продолжительное время). Например: тесты достижений на понимание научных принципов.

Узкоспециализированные – усвоение отдельных принципов, отдельных или учебных предметов. Например: усвоение темы в математике – раздел простые числа – как усвоен этот раздел.

I. 1 Диагностика учебных достижений

психодиагностика тест достижение способность

Для диагностики успешности обучения разрабатываются специальные методы, которые разными авторами называются тестами учебных достижений, тестами успешности, дидактическими тестами и даже тестами учителя (под последними могут также подразумеваться тесты, предназначенные для диагностики профессиональных качеств педагогов). Как утверждает А.Анастази, по численности этот тип тестов занимает первое место.

В литературе встречается следующее определение тестов достижений.

Тесты - это достаточно краткие, стандартизированные или не стандартизированные пробы, испытания, позволяющие за сравнительно короткие промежутки времени оценить преподавателями и студентами результативность познавательной деятельности студентов, т.е. оценить степень икачество достижения каждым студентом целей обучения (целей изучения).

Одним из важных преимуществ тестов достижений над учительской оценкой является их объективность и непредвзятость. Поскольку, зачастую оценка учителя выступает также методом воздействия, отражая в себе отношение учителя к личности ученика.

Удобство тестов достижения состоит в том, что они очень компактны и пригодны для оценки достижений больших групп.

Тесты достижений по конкретным предметам (достижения в чтении и математике) ориентированы на оценку усвоения элементов учебных программ, конкретных тем, уровня владения навыками (например, счетными).

Такие тесты выполняют несколько функций:

· выступают как средство оценки знаний,

· определяют готовность ребенка к обучению в школе,

· выявляют недостатки обучения,

· подсказывают направление последующего обучения,

· обеспечивают мотивацию учащегося,

· помогают приспособить обучение к потребностям индивида,

· дают информацию об уровне знаний, усвоенных учащимися.

Тесты достижений отличаются также и от тестов интеллекта Последние направлены не на диагностику конкретных знаний или фактов, а требуют от учащегося умения совершать с понятиями (пусть даже и учебными) определенные умственные действия, такие, как проведение аналогии, классификации, обобщение и др. Это отражено и в формулировании конкретных заданий тестов того и другого типа.

Отдельные тесты достижений можно объединять в батареи, что позволяет получать профили показателей успешности обучения по разным школьным предметам. Как правило, тестовые батареи предназначены для разных образовательно-возрастных уровней и не всегда дают результаты, которые можно сопоставлять друг с другом для получения целостной картины успешности обучения от класса к классу. Наряду с ними созданы батареи, которые позволяют получать такие данные. Это, например, тесты основных навыков (штата Айова) и успехов в обучении, тесты достижений и тесты учебных навыков Стэнфордского университета и др.

В США тесты достижений получили очень широкое распространение и используются не только в школе, но и в дошкольных учреждениях и для выборок взрослых людей (например, для определения уровня грамотности тех или иных слоев населения).

I. 2 Тесты профессиональных достижений

Тесты профессиональных достижений используются для оценки эффективности обучения профессионалов или профессиональных тренировок. Для отбора людей на наиболее ответственные должности – профотбор. Используется для оценки уровня квалификации работников, при переходе на другую должность. Цель – оценить уровень обученности профессиональным знаниям, навыкам.

Выделяют 3 формы тестов профессиональных достижений:

1. Тесты исполнения. Выполнение ряда заданий, обнаруживающих владение основными навыками или действиями. Используются те механизмы, аппаратура, инструменты, которые используются в трудовой деятельности или моделировании отдельных элементов профессиональной деятельности, способность воспроизводить отдельные операции.

2. Письменные тесты достижений. Используются там, где требуется выяснить, насколько человек владеет специальными знаниями. Задания на бланках. Выполняются в письменной форме с определенной формой ответов.

3. Устные тесты профессиональных достижений. В период первой мировой войны тесты профессиональных достижений использовались для отбора персонала. Серии вопросов, выявляющих специальные знания. Диагностика в виде интервью. Проводилась индивидуально. Удобны в применении. Не нужно распечатывать. Испытуемый должен в заданной форме отвечать.

Тесты профессиональных достижений создаются, как и тесты достижений. Создается большое количество заданий, заведомо больше в несколько раз. Проверяют. Испытывают три группы работников:

1. эксперты высокой квалификации

2. новички

3. представители смежных профессий.

Задание включается в тест, если:

· задание выполнено большинством экспертов (это есть признак валидности)

· задание выполнено меньшим процентом новичков (приблизительно 60-70%)

Диагностика умственного развития и общих способностей

Умственное развитие характеризуется совокупностью знаний, умений и набором умственных действий, которые сформировались в процессе приобретения этих знаний. Таково общепринятое в отечественной психологии понимание умственного развития. По существу, умственное развитие - это характеристика способов, форм и содержания мышления человека. Интеллект - не сумма знаний и умственных операций, а то, что способствует их успешному усвоению. Достигнутый индивидом уровень умственного развития зависит от его интеллектуальных способностей.

Наиболее удачная и жизнеспособная адаптация тестов Бине-Симона, названная шкалами Стэнфорд-Бине, в течение многих лет служила единственным инструментом для измерения интеллектуальных способностей, а также использовалась в качестве критерия валидности новых интеллектуальных тестов. Этим в значительной степени объясняется тот факт, что IQ стал представляться символом интеллекта, а не показателем по определенному тесту. В 1939 г. была опубликована первая форма шкал Дэвида Векслера, известная как шкала интеллекта Векслера-Белльвью. Она предназначалась для тестирования взрослых. Она имела ряд методических недостатков (это касалось величины и репрезентативности нормативной выборки и надежности субтестов) и позднее была переработана. В 1955 г. была опубликована одна из последних шкал интеллекта для взрослых (WAIS). Она содержала 11 субтестов. 6 субтестов составляли вербальную шкалу и 5 - шкалу действия. В вербальную шкалу входили субтесты на осведомленность, понимание, решение арифметических задач, нахождение сходства, запоминание цифр и определение словарного запаса. Шкала действия состояла из субтестов "Цифровые символы", "Завершение картинок", "Конструирование блоков", "Расположение картинок", "Сборка объектов".

Особо рассмотрим тесты интеллекта, разработанные для испытания людей, которых невозможно адекватно оценить с помощью вербальных тестов. Речь идет о младенцах, о детях с дефектами речи, с некоторыми психическими и физическими недостатками, о говорящих на иностранном языке, неграмотных, а также о лицах из неблагоприятной культурной среды и некоторых других. Для исследования этих групп испытуемых применяются либо тесты действия, либо неязыковые тесты, либо тесты, свободные от влияния культуры.

Наряду с тестами интеллекта, специальных и комплексных способностей возник и еще один тип тестов, широко применяемых в учебных заведениях, – тесты достижений. В отличие от тестов интеллекта они отражают не столько влияние многообразного накопленного опыта, сколько влияние специальных программ обучения на эффективность решения тестовых заданий. История развития этих тестов может быть прослежена с момента смены в Бостонской школе устной формы экзаменов на письменную (1845). В Америке тесты достижений начали использоваться при отборе сотрудников на государственную службу уже с 1872 г., а с 1883 г. их применение стало регулярным. Наиболее значительная разработка элементов техники конструирования тестов достижений была выполнена в течение Первой мировой войны и сразу после нее. Тесты достижений относятся к наиболее многочисленной группе диагностических методик. Одним из наиболее известных и широко применяемых до сих пор тестов достижений является Стэндфордский тест достижений (SAT) , впервые опубликованный в 1923 г. С его помощью оценивается уровень обученности в разных классах средних учебных заведений. Значительное число тестов специальных способностей и достижений было создано в рамках психотехники под воздействием практических запросов со стороны промышленности и экономики. Дальнейшее развитие тестов достижений привело к появлению в середине XX в. критериально-ориентированных тестов .



Для диагностики успешности обучения в школе разрабатываются специальные методы, которые разными авторами называются тестами учебных достижений, тестами успешности, дидактическими тестами и даже тестами учителя (под последними могут также подразумеваться тесты, предназначенные для диагностики профессиональных качеств педагогов, либо малоформализованные диагностические средства, которые может использовать учитель, такие, как наблюдение, беседа и др.). Как отмечает американский психолог А. Анас - тази, по численности этот тип тестов занимает первое место.

Тесты достижений предназначены для того, чтобы оценить успешность овладения конкретными знаниями и даже отдельными разделами учебных дисциплин, и являются более объективным показателем обученности школьника, чем отметка. Последняя зачастую становится не только оценкой знаний учащегося, но и инструментом воздействия на него, может выражать отношение учителя к степени его дисциплинированности, организованности, особенностям поведения и т. д. Тесты достижений лишены этих недостатков, разумеется, при условии грамотного их составления и применения.

Тесты достижений отличаются от собственно психологических тестов (способностей, интеллекта). Их отличие от тестов способностей состоит, во - первых, в том, что с их помощью изучают успешность овладения конкретным, ограниченным определенными рамками учебным материалом, например разделом математики "Стереометрия" или курсом английского языка. На формирование способностей (например, пространственных) обучение также будет оказывать влияние, но оно не является единственным фактором, определяющим уровень их развития. Поэтому при диагностике способностей трудно найти однозначное объяснение высокой или низкой степени их развитости у школьника. Во - вторых, различие между тестами определяется целями их применения. Тесты способностей направлены главным образом на выявление предпосылок к тем или иным видам деятельности и претендуют на прогнозирование выбора для индивида наиболее подходящей профессии или профиля обучения. Тесты же достижений применяются для оценки успешности овладения конкретными знаниями, с целью определения эффективности программ, учебников и методов обучения, особенностей работы отдельных учителей, педагогических коллективов, т. е. диагностируют прошлый опыт, результат усвоения тех или иных дисциплин или их разделов. Хотя нельзя отрицать того факта, что тесты достижений также могут в определенной степени предсказывать темпы продвижения учащегося в той или иной учебной дисциплине, поскольку имеющийся на момент тестирования высокий или невысокий уровень овладения знаниями не может не отразиться на дальнейшем процессе обучения. Указывая на разницу в обсуждаемых типах тестов, А. Анастази отмечает, что она наиболее выпукло выступает при оценке их валидности: "Лучший способ оценить тесты способностей - это осуществить прогностическую критериально - ориентированную валидизацию, тогда как тесты достижений в основном оцениваются в терминах валидности по содержанию" (А. Анастази, 1982. Т. 2. С. 37). Тесты достижений отличаются также и от тестов интеллекта Последние направлены не на диагностику конкретных знаний или фактов, а требуют от учащегося умения совершать с понятиями (пусть даже и учебными) определенные умственные действия, такие, как проведение аналогии, классификации, обобщение и др. Это отражено и в формулировании конкретных заданий тестов того и другого типа. Например, тест достижений на материале истории определенного периода может содержать такие вопросы: Заполни пропуски в предложениях: Вторая мировая война началась в. . . году. а) 1945; б) 1941; в) 1939; г) 1935. 22 июля 1941 года фашисты напали на. . . а) Польшу; б) Советский Союз; в) Францию; г) Венгрию. В тесте же умственного развития вопросы с использованием понятий из истории будут иметь следующий вид: Вам даны пять слов. Четыре из них объединены общим признаком, пятое слово к ним не подходит. Его надо найти и подчеркнуть. а) товар; б) город; в) ярмарка; г) натуральное хозяйство; д) деньги. а) рабовладелец; б) раб; в) крестьянин; г) рабочий; д) ремесленник. Для того чтобы правильно ответить на вопросы, входящие в тест достижений, необходимы знания конкретных фактов, дат и др. Старательный ученик, обладающий хорошей памятью, без труда может найти правильные ответы в заданиях теста достижений. Однако если у него плохо сформированы умения работать с понятиями, анализировать их, находить существенные признаки, то задания теста интеллекта могут вызвать значительные затруднения (поскольку для их выполнения только хорошей памяти недостаточно) Необходимо владение целым рядом мыслительных операций, знание тех понятий, на материале которых составлены задания теста.

Современные средства диагностики учебных достижений учащихся по русскому языку и литературе

Важной составной частью процесса обучения является диагностика качества знаний. Она позволяет оценить достижения ученика, сравнить работу преподавателей, выявить пробелы в знаниях, достоинства и недостатки методов обучения.

Для повышения качества обучения педагогу необходимо уметь грамотно выбирать и применять существующие формы и методы диагностики, четко определять цели и функции контроля. История развития контроля знаний насчитывает столько же лет, сколько вся педагогическая деятельность. Целью контроля является определение качества усвоения учащимися программного материала, диагностирование и корректирование их знаний.

Контроль присутствует практически в любом педагогическом процессе. Каждый педагог проверяет результативность обучения и выясняет причины слабой успеваемости. Применительно к повседневному учебному процессу под «контролем» понимают выявление и оценку результатов учебной деятельности обучающихся. Под словом «оценка» имеется в виду не только конечный результат, но и процесс формирования оценки.

В понятие «диагностика» вкладывается более широкий и более глубокий смысл, чем в понятие «контроль». Контроль лишь констатирует результаты, не объясняя их происхождения. Диагностика включает в себя контроль, проверку, учет, оценивание, накопление статистических данных, их анализ, рефлексию, выявление динамики образовательных изменений и личностных приращений ученика, переопределений целей, уточнение образовательных программ, корректировку хода обучения, прогнозирование дальнейшего развития событий.

Диагностика, выполняя функции обратной связи, позволяет педагогу контролировать образовательный процесс, оценивать результаты, корректировать свои действия, строить последующие этапы обучения на основе достигнутого, дифференцировать методы и задания с учетом индивидуального продвижения и развития учащихся.

Не менее важна обратная связь и для учащихся, так как помогает видеть свои недостатки и достижения, получить оценку своей деятельности и советы по ее корректированию.

I .Традиционные средства диагностики

В педагогике выделяются следующие основные виды контроля: текущий, тематический, итоговый.

Текущий контроль - это систематическая проверка и оценка

образовательных результатов ученика по конкретным темам на отдельных занятиях. Желательно, чтобы текущий контроль происходил на каждом уроке. Возможные формы такого контроля: опрос учителя, выполнение тестов, решение задач, работа с компьютерной программой, взаимоконтроль учеников в парах или группах, самоконтроль ученика и др.

Тематический контроль осуществляется по целому разделу учебного курса. Цель - диагностирование качества усвоения учеником структурных основ и взаимосвязей изученного раздела, его личностных образовательных приращений по выделенным ранее направлениям. Задача такого контроля - обучающая, поскольку ученики обучаются систематизации, обобщению, целостному видению крупного блока учебной информации и связанной с нею деятельности.

Итоговый контроль проводится в конце каждой четверти или учебного года. Он может иметь форму контрольной работы, зачета, экзамена, зашиты творческой работы, тестирование. Данный тип контроля предполагает комплексную проверку образовательных результатов по всем ключевым целям и направлениям. Не должно быть так, чтобы цели заявлялись одни, а итоговому контролю подлежали совсем другие параметры или только часть из них.

В соответствии с формами обучения на практике выделяются три формы контроля: индивидуальный, групповой и фронтальный.

При индивидуальном контроле каждый школьник получает свое задание, которое он должен выполнять без посторонней помощи. Эта форма целесообразна в том случае, если требуется выяснять индивидуальные знания, способности и возможности отдельных учащихся.

При групповом контроле класс временно делится на несколько групп (от 2 до 10 учащихся) и каждой группе дается проверочное задание. В зависимости от цели контроля группам предлагают одинаковые или дифференцированные задания, проверяют результаты письменно - графического задания, выполненного учениками по двое, или практического, которое выполняется каждой четверкой учащихся, или проверяют точность, скорость и качество выполнения конкретного задания по звеньям. Групповую форму организации контроля применяют при повторении с целью обобщения и систематизации учебного материала, при выделении приемов и методов решения задач, при акцентировании внимания учащихся на наиболее рациональных способах выполнения заданий, на лучшем из вариантов доказательства теоремы и т. п.

При фронтальном контроле задания предлагаются всему классу. В процессе этой проверки изучается правильность восприятия и понимания учебного

материала, качество словесного, графического предметного оформления, степень закрепления в памяти.

Для организации диагностики важно определить содержание и методы контроля, то есть выяснить, что именно и как будет контролироваться. В практике преподавания в настоящее время используются различные методы контроля качества знаний учащихся. Чаще всего применяются разные формы устной проверки и проведение разнообразных письменных работ.

При фронтальном устном опросе за короткое время проверяется состояние знаний учащихся всего класса по определенному вопросу или группе вопросов. Эта форма проверки используется для:

    выяснения готовности класса к изучению нового материала,

    определения сформированности понятий,

    проверки домашних заданий,

    поэтапной или окончательной проверки учебного материала, только что разобранного на уроке,

    при подготовке к выполнению практических и лабораторных работ.

Индивидуальный устный опрос позволяет выявить правильность ответа по содержанию, его последовательность, самостоятельность суждений и выводов, степень развития логического мышления, культуру речи учащихся. Эта форма применяется для текущего и тематического учета, а также для отработки и развития экспериментальных умений учащихся. Причем устную проверку считают эффективной, если она направлена на выявление осмысленности восприятия знаний и осознанности их использования, если она стимулирует самостоятельность и творческую активность учащихся.

Устный опрос осуществляется на каждом уроке, хотя оценивать знания учеников не обязательно. Главным в контроле знаний является определение проблемных мест в усвоении учебного материала и фиксирование внимания учеников на сложных понятиях, явлениях, процессах.

В процессе устного опроса можно использовать коллективную работу класса, наиболее действенными приемами которой являются:

    обращение с вопросом ко всему классу,

    конструирование ответа,

    рецензирование ответа,

    оценка ответа и ее обоснование,

    постановка вопросов ученику самими учащимися,

    взаимопроверка,

    самопроверка.

Для устного контроля можно использовать листы контроля знаний.

Письменный контроль эффективнее развивает логическое мышление, приучает к большей точности в ответах. Письменная проверка позволяет за короткое время проверить знания большого числа учащихся одновременно. Используется письменный контроль знаний учащихся в целях диагностики умения применять знания в учебной практике и осуществляется в виде диктантов, контрольных, проверочных и самостоятельных работ, тестов, рефератов.

Диктант

Диктант используется как форма опроса для контроля за усвоением проходимого материала, его обобщения и систематизации и выявления готовности учащихся к восприятию нового. Диктант обычно проводится в самом начале урока, состоит из двух вариантов. Текст вопросов простой, легко воспринимаемый на слух, требующий краткого ответа, несложных вычислений. Пауза между следующими друг за другом вопросами должна быть достаточной для записи ответов учащимися.

Самостоятельная работа

Традиционная форма контроля знаний, которая по своему назначению делится на обучающую самостоятельную работу и контролирующую. Самостоятельная работа творческого характера позволит не только проверить определенные знания, умения, но и развивать творческие способности учащихся. Самостоятельная работа является необходимым этапом любой темы. Как правило, она проводится после коллективного решения или обсуждения задач новой темы и обязательно предшествует контрольной работе по этой теме. Работа выполняется без помощи учителя.

Контрольная работа

Контрольные работы проводятся с целью определения конечного результата обучения по данной теме или разделу, контролировать знания одного и того же материала неоднократно. Целесообразно проводить контрольные работы различного вида. С помощью промежуточной контрольной работы учитель проверяет усвоение учащимися материала в период изучения темы. Итоговая контрольная работа проводится с целью проверки знаний и умений учащихся по отдельной теме, курсу. Домашняя контрольная работа дается 1-2 раза в учебном году. Она призвана систематизировать знания, позволяет повторить и закрепить материал. При ее выполнении учащиеся не ограничены временем, могут использовать любые учебные пособия, проконсультироваться у учителя, родителей, одноклассников. Каждому ученику дается свой вариант работы, в который включаются творческие задания для формирования разносторонней развитой личности.

Практическая работа

Для закрепления теоретических знаний и отработки навыков и умений, способности применять знания при решении конкретных задач используется практическая работа, которая связана не только с заданием на компьютере, но и, например, может включать задания построения схемы, таблицы, написания программы и т.д.

Лабораторная работа

Лабораторная работа - достаточно необычная форма контроля, она требует от учащихся не только наличия знаний, но еще и умений применять эти знания в новых ситуациях, сообразительности. Используется лабораторная работа для закрепления определенных навыков с программными средствами, когда кроме алгоритмических предписаний в задании учащийся может получать консультации учителя. Так как лабораторная работа может проверить ограниченный круг деятельности, ее целесообразно комбинировать с такими формами контроля, как диктант или тест.

Зачет

Зачет проводится для определения достижения конечных результатов обучения по определенной теме каждым учащимся. Перед началом изучения материала учащиеся знакомятся с перечнем вопросов и обязательных задач по теме, а также дополнительными вопросами и задачами. Иногда целесообразны закрытые зачеты, когда учащиеся получают вопросы и задания непосредственно во время проведения зачета. Его достоинство заключается в том, что он предполагает комплексную проверку всех знаний и умений учащихся. Необходимость такого тематического контроля обусловлена тем, что для каждого ученика характерен определенный темп овладения учебным материалом. А потому обычные контрольные работы, в которых трудно учесть должным образом индивидуальные особенности учащихся, могут оказаться недостаточными для того, чтобы судить, достигнуты ли планируемые результаты обучения.

Зачет - это одна из основных форм контроля в старших классах.

Тематические зачеты должны быть дифференцированными, чтобы ученик мог самостоятельно выбрать уровень зачета. Учитель решает, основываясь на результатах прошлых или промежуточных контрольных мероприятий, какие знания и умения целесообразно проверять у какого ученика: всем даются индивидуальные задания. Ученик может решать задачи, потом делать лабораторную работу, а затем беседовать с учителем.

Формы контроля могут быть разнообразны. Традиционные формы диагностики качества знаний основаны на непосредственном общении учителя с учеником. Это очень важно, ведь такой контроль выполняет обучающие функции, вооружает педагогов информацией об уровне знаний, опробелах в их подготовке и даже об эмоционально-психологическом состоянии класса. Но существующие традиционные формы диагностики не позволяют учителю осуществить регулярную обратную связь в обучении, проводить оперативную обработку информации и принимать соответствующие решения по коррекции учебного процесса.

Кроме того, контроль, проводимый традиционными формами, не лишен субъективизма, несмотря на рекомендуемые общие критерии оценки, уровень требований преподавателей различен. У каждого имеется свое понимание принципов требовательности и справедливости, свои критерии качества знаний. На оценку преподавателя влияют его личностные установки по отношению к оцениваемому ученику и предыдущий процесс общения с учащимся. Поэтому возникает необходимость в новых видах проверки знаний.

В последнее время в практику преподавания активно внедряется более объективная форма контроля - тестирование.

Преподаватели неоднозначно относятся к тестированию: одни являются активными сторонниками этого метода, повсеместно внедряют его и используют, а другие – не приемлют тесты, считая их недостойным инструментом контроля. Обычно, доводы, как сторонников, так и противников тестирования не отличаются достаточной аргументацией или научным обоснованием. Чаще всего и те и другие ссылаются на опыт США, где тестирование применяется повсеместно и является основным методом контроля знаний. Сторонники отмечают высокий уровень развития американского общества и науки в частности, а противники справедливо отмечают, что в большинстве своем, качество американского образования находится на невысоком уровне.

Тестирование с учетом ограничений и условий применимости имеет ряд преимуществ: объективность, возможность тренинга, технологичность, оперативность обработки результатов, возможность автоматизации диагностики качества знаний, обработка и накопление статистических данных, что ставит их на одно из ведущих мест в диагностике качества знаний.