Полная версия
Педагогическое тестирование: Проблемы, заблуждения, перспективы
Перечисленные в последнем абзаце компетентности составляют лишь часть того набора компетентностей, которые обеспечивают достижение почти любой практически значимой и подлежащей оцениванию цели, и они в определенной степени взаимозаменяемы.[4] Мы их выделили в связи с предметным обучением, но мы могли бы их также обнаружить и при анализе других занятий, которые люди ценят и которым охотно предаются. Однако, оставаясь в рамках академической предметно-ориентированной парадигмы тестирования и оценки учащихся, важно заметить, что второй из упомянутых выше учеников проявил мотивацию к иным занятиям и, соответственно, развил другой набор компетентностей и способностей, способов мышления и восприятия в процессе предпринятого им оригинального исторического исследования. Третий развил похожий – но ни в коем случае не идентичный – набор компетентностей, необходимых для выполнения высококлассной социологической работы. То же можно сказать и о других учениках.
Если традиционные способы оценивания не могут зафиксировать наличие необычных, узкоспециальных знаний, то еще в меньшей степени они способны улавливать формирование навыков особого рода, мотивов и привычек, способов мышления и видов деятельности, способных составить в будущем арсенал компетентного ученого, историка, социолога, фотографа, репортера, повара или родителя.
Но и это еще не исчерпывает всех проблем, которые возникают при оценке подобного нетрадиционного учебного процесса.
Учащиеся работали в группах. В этих группах у них сложились определенные роли. В процессе работы они развили определенные компетентности, необходимые для эффективного выполнения соответствующих функций в группе. Один ученик научился эффективно координировать работу нескольких человек. Другой – успокаивать товарищей и сглаживать межличностные трения. Третий – вести переговоры. Четвертый – представлять результаты чужой работы официальным лицам, посетителям и посторонним людям, а не только своему учителю. И так далее. В процессе выполнения этих работ каждый учился общаться, изобретать, проводить собственные наблюдения, сотрудничать с другими, руководить и подчиняться.
Все эти компетентности чрезвычайно важны, однако они не «схватываются» общепринятыми измерениями. А без средств для оценки этих качеств учащиеся, которые прошли через такие обучающие программы, не смогут узнать, чем они отличаются от тех, кто обучался по другим программам. Еще меньше они могут узнать, чем они отличаются друг от друга: что они по-другому думают, по-другому видят окружающее, имеют другие приоритеты, иначе взаимодействуют с людьми и владеют разными навыками. Не имеющий средств для оценки этих качеств учитель, разрабатывая следующий проект, не сможет учесть те компетентности, которые достигнуты учениками при выполнении предыдущего. Ученики не имеют возможности предъявить документальное подтверждение способностей, которые они приобрели в процессе такого обучения, когда они хотят получить работу или продолжить образование. Учителя не получают признания своих заслуг в развитии этих способностей у учащихся по результатам выполнения ими итоговых тестов. На социальном уровне мы не можем воспрепятствовать тому, чтобы люди, у которых отсутствуют социально значимые потребности и вышеупомянутые интеллектуальные качества, занимали влиятельное положение в обществе. Но хуже всего то, что отсутствие средств оценки таких качеств ограничивает наши представления об образовании. При нынешнем положении дел даже слово «академический» не охватывает всего того круга занятий, в процессе которых люди наблюдают, обдумывают, размышляют, выносят суждения, оттачивают аргументы и готовят публичную презентацию важного материала.
Прежде чем двигаться дальше, отметим, что сам факт выявления такого рода знаний и способностей показывает, что проблема педагогического оценивания и измерения принципиально разрешима. Вот что мы делали в процессе этого исследования:
• наблюдали за учениками в процессе выполнения интересных для них заданий;
• фиксировали многочисленные и взаимозаменяемые компетентности, которые они проявляли при выполнении этих заданий;
• приняли описательный подход при заполнении протоколов наблюдения вместо того, чтобы фиксировать результаты в баллах или «переменных»;
• различали учеников по занятиям, которые их интересовали, и компетентностям, которые они проявляли в ходе этих занятий.
Основная мысль следующих глав состоит в том, чтобы показать возможность построения альтернативной концепции оценки содержания, методов и результатов обучения.
Традиционная оценка программ обучения ведет к некорректным выводам
Показав проблемы, которые передовая педагогическая практика ставит перед традиционным оцениванием, я перейду теперь к рассмотрению некоторых крайне дезориентирующих выводов исследований, выполненных в рамках доминирующей измерительной парадигмы, и обосную необходимость альтернативной измерительной концепции.
Исследования показали, что обучение по программе «Открытое образование» приводит к снижению баллов при традиционной тестовой оценке чтения, письма и счета. Stallings[5] обнаружила то же самое при оценке программы «Помощь на старте» («Headstart Follow Through» – программа, направленная на развитие интеллектуального потенциала учащихся, принадлежащих к низшему социо-экономическому слою. – Примеч. переводчиков). Однако она отметила и кое-что еще: «Открытое образование» повышает остроту восприятия и мышления – фактор, измеряемый с помощью теста «Прогрессивные матрицы Равена».[6] («Прогрессивные матрицы Равена» – один из классических тестов интеллектуальных способностей; разработан Дж. К. Ра-веном-старшим, отцом автора данной книги. – Примеч. переводчиков.) Теперь спросим: какие выводы получились бы, если при оценке результатов «Открытого образования» использовались бы тесты, направленные на измерение наиболее значимых для этих программ качеств (лидерства, способности работать с другими, общаться, понимать других людей и оказывать на них влияние) и чувствительные к особенностям приобретенного в обучении опыта (вместо тестов, сконструированных так, чтобы результаты по ним как можно меньше зависели от этого опыта)? Очень возможно, что удалось бы обнаружить существенные позитивные результаты данной программы. Важно отметить, что даже использование очень хороших тестов для оценки навыков чтения, письма и счета может привести к противоречивым результатам. Традиционные измерения навыка чтения не в состоянии оценить стратегии работы с текстом, такие, как отказ от дальнейшего чтения книги или статьи, не соответствующей цели чтения, использование оглавления для поиска нужной информации или привлечение прочитанного для стимуляции собственных размышлений. Программы обучения, способствующие развитию такого высокого уровня компетентности читателя, могут легко привести к снижению оценок по таким тестам, которые измеряют готовность прочесть фрагмент неинтересного текста и способность запомнить ответы, которые испытуемый легко нашел бы, если бы они ему понадобились. Как показали Bullock[7] и McClelland,[8] традиционные тесты по английскому языку не измеряют способности эффективно общаться. Действительно, станет ли беспокоиться о нарушениях грамматических правил тот, кто способен влиять на аудиторию посредством намека, аллюзии, привлечения широкого контекста?[9] (Cockcroft[10] пришел к аналогичным выводам в отношении арифметики.)
Прочитав последний абзац, легко согласиться и сказать: «Ну, конечно!» – однако не сделать самых важных выводов.
Как утверждается в изданных Объединенным комитетом «Стандартах экспертизы образовательных программ, проектов и материалов»,[11] экспертные заключения должны опираться только на результаты, полученные с помощью надежных и валидных тестов. К сожалению, трудно понять, как можно считать валидным измерение, если оно не способно зафиксировать наиболее важные результаты педагогического процесса; не служит оправданием данной ситуации и то, что в настоящее время нет надежных и валидных тестов для выявления этих результатов. Многие из самых важных результатов образовательного процесса очень трудно оценить формально, потому что им, как и результатам экономического или социального развития, требуется немало лет, чтобы проявиться в полной мере. Отказ от обсуждения результатов, которые в данный момент не поддаются измерению «надежными и валидными тестами», уводит дискуссии о политике в сфере образования от обсуждения реального педагогического процесса и его наиболее важных результатов к обсуждению того, что легче всего измерить. Объединенный комитет не проявляет беспокойства по этому поводу, а Стэнфордский исследовательский институт (где работала Stallings) однажды даже лишился контракта, когда указал, что для проведения квалифицированной экспертизы придется сначала разработать измерители такого рода результатов. Это позволяет предположить, что существует глубоко укоренившееся нежелание рассматривать те последствия, которые происходят от недостатка адекватных способов выявления и измерения более широкого спектра результатов педагогического процесса. Одним из ярких проявлений этой позиции служит нынешнее слепое применение тестов на оценку компе-тентностей элементарного уровня как показателей эффективности обучения. Как-то ускользает от внимания то обстоятельство, что эти тесты вообще неспособны оценивать обсуждавшиеся выше результаты обучения и поэтому не должны рассматриваться в качестве тестов эффективности обучения. Вопреки заявлениям, звучащим в начале большинства докладов и речей по проблемам образования, внимание политиков, школьных реформаторов, администраторов, учителей, родителей и учащихся, тем не менее, полностью сосредоточено на элементарных результатах, которые, как будет показано дальше, не имеют особого значения ни для отдельных людей, ни для всего общества. И эти доклады, и политика в сфере образования в целом совершенно справедливо были названы бывшим английским премьер-министром Эдвардом Хитом «лукавым трюком». Есть все основания опасаться, что отсутствие связи между правильно поставленными высокими целями, верно сформулированными проблемами в образовании и существующими способами «контроля качества» приведет к игнорированию имеющихся трудностей и не позволит достигнуть желаемых целей. В то же время контроль качества образования, направленный на измерение не тех результатов, которые хотелось бы получить, уводит всех работающих в системе образования и определяющих политику в этой области в ложном направлении.
Второй пример неадекватных выводов, сделанных исследователями, находящимися в плену существующей парадигмы педагогических измерений, заимствован нами из работ по программе «Совершенствование школьных навыков» («Mastery learnings»). Если кто-нибудь спросит, что в первую очередь станет делать ученик – участник программы «Совершенствование школьных навыков», когда он, выполнив задание, ждет, пока остальные его догонят, то получит ответ: он либо будет помогать своим более медлительным товарищам, либо пойдет играть в футбол. Таким образом, эти ученики не только узнают, что они «умные» (то есть способны быстро справляться с рутинными заданиями), но они также имеют возможность развить какие-то дополнительные компетентности – необходимые, например, чтобы учить других или чтобы играть в футбол. Другими словами, это ведет также к возрастанию различий между учениками в такого рода компетент-ностях. Итак, вопреки цели выравнивания школьных достижений, на которую направлена программа «Совершенствование школьных навыков», она просто перемещает неравенство учащихся в иную, неконтролируемую область. Еще серьезнее то, что, заставляя учеников выполнять задания, в которых они не могут добиться успеха, такого рода программы лишают медлительных, отстающих учеников возможности упражнять и развивать их наиболее важные и наиболее оригинальные способности. То же самое происходит, например, при стандартизированной проверке базовых навыков перед допуском учеников к выполнению новых заданий (например, к работе в проектах) и в большинстве «кор-рекционных» программ, которые требуют, чтобы дети с трудностями в обучении проводили едва ли не все свое учебное время в работе над базовыми навыками. Эти программы формируют такую самодостаточную среду, в которой только и можно выразить различие между учениками по какой-то одной единственной «способности». Медлительные ученики фактически лишены возможности попрактиковать свои способности в изобретательстве, умении убеждать, лидерстве, общении и слушании в процессе деятельности, которая их интересует. К тому же они лишены возможности показать, что, находясь в обстоятельствах, не выставляющих их в смешном виде, они, несмотря на свои «низкие способности», на самом-то деле могут хорошо справиться по крайней мере с некоторыми заданиями. Подобные процедуры обучения и контроля рождают представление об особой значимости фактора общих способностей. Если бы те люди, которые заказывали разработку и экспертизу школьных навыков, обладали бы более широкими и разносторонними взглядами на образование, на педагогические достижения и попытались бы содействовать развитию разнообразных способностей учащихся, а эксперты, в свою очередь, постарались измерить более широкий спектр результатов образования, их выводы были бы существенно иными.
Программа «Совершенствование школьных навыков» может быть использована для иллюстрации еще одного фундаментального порока современной теории тестов. Несмотря на все сказанное выше в адрес экспериментальных программ развития школьных навыков, ее основная философская установка правильна: если определенным учащимся действительно важно освоить некий навык, они его осваивают. Если же этого не происходит, то виновата программа. Когда освоение этого навыка или материала неважно для учащихся, они и не должны этому учиться. Отсутствие положительных результатов обучения означает, что либо учащимся некомпетентно преподавали, либо они не получили адекватной помощи и руководства. Другими словами, не выработанное в процессе обучения умение – это приговор способу обучения, а не самому ученику. Отсюда следует поистине катастрофический вывод для применяемых в настоящее время моделей измерения результатов обучения, поскольку большинство из них основано на предположении, что «нормальное распределение» педагогических результатов – явление не только ожидаемое, но и желательное. Как бы ни обстояло дело с врожденными способностями учащихся, это допущение не применимо к тем способностям, которые должны формироваться в процессе обучения.
Третий пример ошибочных выводов, сделанных в результате применения традиционных измерений в экспертных исследованиях, основан на работе Coleman[12] и отчете Международной ассоциации по оценке достижений в сфере образования.[13] В обеих этих работах представлены доказательства того, что «разные школы не отличаются друг от друга». Обе работы использовали традиционные тесты для измерения достижений в обучении. В обоих случаях попытались выявить зависимость результатов обучения от особенностей учителей. И когда статистическими методами исключили влияние таких факторов, как «домашняя ситуация» и «способности» детей, получили вывод, что «школы не различаются». Этот абсурдный вывод был получен благодаря тому, что использовались тесты, сконструированные специально для измерения содержания, общего для всех педагогических программ. В них не могли проявиться особенности профессиональной компетентности отдельного учителя. Другими словами, даже наиболее вероятные различия между учителями не могли быть выявлены в принципе.
Когда мы сами попытались измерить и как-то зафиксировать нестандартные результаты, полученные учениками при работе с конкретным учителем (а не то, научились ли они чему-то такому, что некий исследователь полагает необходимым для освоения текущего материала), и включили в опросники для учащихся нежелательные результаты наряду с желательными, мы обнаружили огромные различия во влиянии разных учителей на самооценки, набор компетентностей, ценности и приоритеты, складывающиеся у их учеников. Ученики из разных классов овладевали чрезвычайно разными умениями, многие из которых не только не подразумевались учителем, но и не несли никакой функциональной нагрузки. То же самое было отмечено и в ходе единственной исследованной нами обучающей программы проектного типа – то, что усваивал один ученик, значительно отличалось от того, что усваивали другие. Учащиеся выбирали и выполняли разные виды деятельности и, следовательно, оказывались в разной образовательной среде.
Выводы
Было показано, что традиционные тесты достижений не могут должным образом оценить результаты педагогического – в полном смысле этого слова – процесса; что они не подходят для выявления одаренности учащихся; что при попытках улучшить качество образования доверие к тестам уводит внимание учителей от тех целей, которые особо подчеркиваются при обсуждении недостатков системы образования, в сторону частных, незначительных целей; что они сужают наши представления об образовании вообще и об академическом образовании в частности и что их общепринятое применение при экспертизе содержания и методов обучения приводит к выводам, которые в лучшем случае некорректны, а по большому счету противоречат интересам как ученика, так и всего общества.
Остается добавить, что учителям совершенно необходимо иметь средства выявления интересов и способностей учеников, чтобы эффективно использовать обучающие программы. Им нужно уметь следить за продвижением учеников к цели, чтобы, если это понадобится, предпринять адекватные коррекционные действия. Ученикам необходимы средства, позволяющие определить, чему именно они научились и чем они отличаются от других учеников, обучающихся по другим программам. Они должны иметь возможность получить признание своих достижений. Учителям и администраторам необходимо уметь выявлять относительные преимущества разных программ, а также определять, в каких отношениях эти программы хороши, а в каких нет и как их можно улучшить.[14]
Очевидно, что новая концепция измерения и оценки навыков и способностей учащихся остро необходима всей системе образования.
Однако примеры, которые я привел, содержат не только критику. Они также указывают основание, на котором можно было бы построить альтернативную концепцию: вместо использования «надежных и валидных» измерений лишь отдельных результатов педагогического процесса следует попытаться описать всю область его возможного влияния.[15] Это предполагает, что альтернативная концепция измерений могла бы основываться на наглядных описаниях, аналогичных химическим, а не на установлении связи между переменными, как в физике. Подробнее мы раскроем эту идею в следующих главах. А пока, поскольку мы назвали еще далеко не все негативные последствия современной измерительной и оценочной практики и не привели достаточно свидетельств в пользу альтернативной измерительной концепции, рассмотрим еще несколько важных примеров.
ГЛАВА 2
НЕОБХОДИМОСТЬ ФУНДАМЕНТАЛЬНОЙ РЕФОРМЫ СПОСОБОВ ОЦЕНИВАНИЯ В СИСТЕМЕ ОБРАЗОВАНИЯ
В этой главе будут обсуждаться причины того, почему людям, связанным с проблемами образования, принципиально важно найти способы выявления таких индивидуальных качеств, как инициатива и желание участвовать в общественной жизни, – качеств, ускользающих от психометристов на протяжении всей истории психологии. Мы затронем здесь семь таких причин, которые можно объединить в четыре группы: 1) то, чему уделяется основное внимание в школах и что служит предметом дискуссий о политике в сфере образования, в действительности определяется самими показателями тестов учебных достижений; 2) учителя и ученики нуждаются в адекватных методических средствах для контроля за своим продвижением к поставленным целям и успешностью их достижения; 3) принятым в настоящее время способам оценивания учебной деятельности недостает конструктной и прогностической валидности, и они не позволяют нам исключить случаи, когда некомпетентные люди с неадекватными амбициями занимают влиятельное положение в обществе; 4) современные процедуры педагогического измерения необъективны.
1. Содержание выпускных экзаменов и квалификационных испытаний при приеме па работу обусловливает происходящее в школе и последовательно вытесняет из нее все, что достойно называться образованием
В исследовании, которое к настоящему времени проведено в Англии,[16] Шотландии,[17] Северной Ирландии,[18] Ирландии,[19] Бельгии[20] и США,[21] учащимся, их учителям, родителям, выпускникам школ и работодателям предлагали оценить важность различных потенциальных целей образования.
В таблице 1 приведены ответы ирландских мальчиков-подростков.
Таблица 1
Важность целей образования для мальчиков
(Указан процент мальчиков, оценивших данную цель как «очень важную».)
Условные обозначения к таблицам 1-4
Эти данные интересны во многих отношениях, однако здесь мы обсудим только три их аспекта.
Во-первых, по мнению мальчиков, наиболее важные цели обучения включают развитие уверенности и инициативы, требующихся для реформаторской деятельности; формирование независимости и способности применять знания для решения новых проблем; воспитание личности и характера. Эти данные бросают вызов широко распространенному мнению, что школу не должны волновать социальные изменения; они, в частности, заставляют сомневаться в выводе Goodlad,[22] что общество практически не требует от школы, чтобы она влияла на личностное развитие учащихся. Похоже, что непосредственные потребители услуг школы (ученики) хотят, чтобы она в большей степени содействовала развитию именно таких качеств, в развитии которых большинство педагогов не хочет принимать участия.
Во-вторых, ученики считают очень важной помощь школы в выборе профессиональной карьеры. Когда мы спросили их, должна ли школа делать больше для достижения этих целей, чем делает сейчас, оказалось, что помощью в выборе карьеры школа пренебрегает более всего. Flanagan[23] и Bachman[24] в своих лонгитюдных исследованиях подтвердили правильность этого мнения. Теряется масса времени, возникают тяжелые стрессы, пока, наконец, в своих скитаниях на рынке труда люди не найдут ту нишу, которая, удовлетворит их личные интересы и склонности. Поступление на работу для многих становится, по существу, первой возможностью определить и развить свой истинный потенциал. Однако учащиеся (как и многие исследователи, включая и самого Flanagan[25]) ошибочно формулируют эту проблему как отсутствие помощи в выборе карьеры. На самом деле в любой профессиональной группе имеется множество людей с абсолютно разными мотивами и способностями, которые занимаются самыми разными видами деятельности. Так, среди психологов есть те, кто руководит компаниями, и те, кто занят исследовательской работой, а также преподаватели, редакторы журналов, политики и секретари. C.Taylor[26] выделил 12 типов выдающихся исследователей и 25 типов выдающихся физиков. Это все очень разные люди, у них разные способности и области специализации. Следовательно, данные говорят о том, что учащиеся на самом деле нуждаются в средствах выявления и развития их индивидуальных способностей, в помощи по поиску возможности их применения и, наконец, в том, чтобы их оценили по достоинству.
В-третьих, из приведенной таблицы видно, что хотя мальчики и отводят успешной сдаче экзаменов второе-третье место, они в то же время помещают такие ценности, как более широкое, чем это требуется для экзаменов, знание предмета и изучение внепрограммных предметов, в конец списка своих приоритетов (45-е и 41-е места соответственно). Факт такого расхождения в сочетании с другими данными – такими, как беспокойство, которое они испытывают на информативных и интересных, но не предусмотренных программой уроках, – дает основание считать, что, заявляя о желании получить хорошее образование, они все же имеют в виду высокие отметки. При этом содержание изучаемого предмета не так важно. Данные Goodlad[27] убедительно подтверждают этот вывод.
Все эти результаты имеют огромное значение: мальчики-подростки хотят изменений, они хотят, чтобы школа помогла им реализовать себя, помогла выявить и развить их индивидуальные способности и обеспечила признание этих способностей; при этом они не считают таким уж важным содержание того, что называется академическим образованием. Говоря, что школы должны сосредоточиться на академических целях, они имеют в виду, что хотят получить сертификаты об образовании, которые обеспечат им доступ к работе, а эти сертификаты в настоящее время могут быть получены только через так называемые академические занятия (впрочем, очень редко заслуживающие такого определения).