Тестовый контроль в образовании
Шрифт:
241. Linn K.L. Educational Measurement (3 ed.). – N.Y.: Macmillan, 1989.
242. Lord F.M. Application of Item Response Theory to Practical Testing Problems. Hillsdale. – N.Y.: Lawtrence Erlbaum Ass. Publ., 1980. – 266 p.
243. Lord F.M. Estimating Item Characteristic Curves Without Knowledge of Their Mathematical Form // Psyhometrika. – 1970. – № 35. – P. 43—50.
244. Lord F.M., Novick M. Statistical Theories of Mental Test Scores. – Addison Wesley Publ & Co., Reading, MA, 1968. – 568 p.
245. Measuring studentknowledge and skills. A New Framework for Assessment. OECD, 1999.
246. Nieves Segovia Bonet. Quality and Innovation in Education // 43 ed. European Quality Congress. Proceeding Book. – Madrid, 9 —11 June, 1999. Forum CALIDAD. – P. 217 —219.
247. Rasch G Probabilistic Models for Some Intelligence and Attainment Tests, Copenhagen, Denmark: Danish Institute for Educational Research. – Munksgaard, Copenhagen, 1960. – 216 p.
248. Rasch G On Specific Objectivity: An Attempt of Formalizing the Generality and Validity of Scientific Statements // Danish Yearbook of Philosophy. – 1997. – V. 14. –
249. Rasch G. Probabilistic Model for Some Intelligence and Attainment Tests. With a Foreword and Afteword by B.D. Wright / The Univ. Of Chicago Press. – Chicago & London, 1980. – 199 p.
250. The PISA 2003 Assessment Framework–Mathematics, Reading, Science and Problem Solving Knowledge and Skills, OECD, 2003.
251. Thorndike R.L. Applied Psychometrics. – Boston: Houghton. Miffli Co, 1982.
252. Weiss D.J., Kingsbury G.G. Application of computerized adaptive testing to educational problems // Journal of Educational Measurement. – 1984. – № 21. – P. 361—375.
ПРИЛОЖЕНИЯ
Приложение 1
ОТРАСЛЕВОЙ ТЕРМИНОЛОГИЧЕСКИЙ СТАНДАРТ
По материалам Т.М. Балыхиной, М.Е. Кошелюка, В.Ж. Куклина, А.Н. Майорова, В.А. Хлебникова, М.Б. Челышковой, А.Г. Шмелева (www. ege.edu.ru)
Адаптивное (последовательное) тестирование – вид компьютерного тестирования, при котором тестовые задания с известными характеристиками последовательно изображаются на экране компьютера, а уровень подготовленности испытуемого со все возрастающей точностью оценивается сразу же после каждого его ответа. Очередное задание в зависимости от ранее данных ответов испытуемых подбирается так, чтобы его уровень трудности позволял наилучшим образом оценить уровень подготовленности тестируемого. Количество заданий теста заранее не фиксируется, а процесс тестирования заканчивается по достижении заданной точности оценки уровня подготовленности испытуемого.
Апробация теста – предварительное тестирование стратифицированной выборки испытуемых для определения соответствия теста его целям и априорным характеристикам. Апробация – необходимый этап для создаваемого теста перед его использованием.
Ассоциации в тестовом задании – словесная подсказка в содержании задания, позволяющая тестируемому угадать правильный ответ; свидетельство некорректности задания.
Балл истинный – латентный параметр, представляющий собой тот балл, которому объективно соответствует уровень подготовленности данного испытуемого при указанной методике оценивания (при этом условно предполагается, что ошибки измерений отсутствуют).
Балл категории ответа на тестовое задание – балл, соответствующий определенной категории ответа на политомическое задание теста в зависимости от полноты ответа (например, категория ответа на уровне узнавания – один балл, на уровне репродукции – два балла, на уровне оперативного применения – 3 балла и т.д.).
Балл критериальный – граничное значение тестового балла, с помощью которого заданная выборка тестируемых разделяется на выполнивших данный тест (зачет) и не выполнивших (незачет).
Балл первичный дихотомического задания – количество участников тестирования, верно выполнивших данное задание, отражает некоторую меру трудности задания.
Балл первичный испытуемого – сумма баллов за ответы на тестовые задания, которые испытуемый указал в качестве правильных. Для тестов, состоящих из дихотомических заданий, количество верно выполненных заданий отражает некоторую меру подготовленности данного испытуемого относительно данного теста.
Балл первичный категории задания – количество участников тестирования, указавших данную категорию ответа для определенного задания в качестве правильного ответа, в случае дихотомического задания совпадает с первичным баллом этого задания.
Балл тестовый – окончательное количественное выражение по определенной шкале индивидуальной оценки уровня подготовленности тестируемого, полученное на основании стандартизованной обработки результатов выполнения испытуемым тестовых заданий.
Банк тестовых материалов – совокупность систематизированных тестовых заданий и тестов, разработанных различными авторами для различных целей, прошедших апробацию и имеющих известные характеристики.
Бланк ответа – стандартный бланк для ответов на задания теста; тестируемый отмечает или записывает номера выбранных ответов или сами ответы.
Валидизация – процедура улучшения валидности теста по результатам критериальной оценки.
Валидность теста критериальная – характеристика теста, отражающая показатель соответствия диагноза и прогноза теста определенным внешним критериям, характеризующим объект измерения.
Валидность теста прогностическая – частный случай валид–ности критериальной. Отражает эффективность прогноза теста о возможностях испытуемых в будущем.
Валидность теста содержательная – характеристика теста, выражающая показатель охвата заданиями теста той области знания, подготовленность в которой этот тест оценивает.