АНАЛИЗ НА ВЪНШНОТО ОЦЕНЯВАНЕ ПО МАТЕМАТИКА ЗА ЧЕТВЪРТИ КЛАС ЗА 2012 Г. В БЪЛГАРИЯ
Резюме. Статията представлява продължение на материал, посветен на анализа на резултатите от външното оценяване на постиженията на учениците по математика в четвърти клас за 2011 г. В настоящата статията се анализират данните за 2012 г. Статията включва:
• анализ на психометричните характеристики на теста по математика;
• общ анализ на постиженията на учениците;
• анализ на различията в постиженията на учениците според различни техни характеристики.
Ключови думи: external evaluation 2012, mathematics, general analysis
Увод
Настоящата статия представлява продължение на статия, анализираща резултатите от външното оценяване по математика в четвърти клас за 2011 г.
В тази статия се прави анализ на постиженията на учениците за 2012 г. с представителна извадка 5600 ученици, като общият брой на участвалите във външното оценяване по математика четвъртокласници за 2012 г. е 57 910 във всички 28 региона.
Описание
Общата оценка по математика се състои от сумирането на точките от тест с 20 задачи с избираем отговор (3 алтернативи).
Резултатите от външното оценяване на IV клас са по своята същност базови. Получените разлики по региони, общини, пол и най-често говорим език в семейството имат констативен характер.
В спецификацията на теста по математика, важаща както за теста от 2011 г., така и за този от 2012 г., са дадени част от държавните образователни изисквания за знания и умения по математика в края на IV клас. Малкият обем на теста налага проверката да се осъществи само върху най-важните компоненти от учебното съдържание, без усвояването на които е невъзможно по-нататъшното обучение (Банков и Витанов, 2006).
В следващата таблица (табл. 1) са дадени видът на задачите по различните елементи на учебното съдържание, както и съответната познавателна област.
Таблица 1. Задачи по различните елементи на учебното съдържание и съответната познавателна област
Психометрични показатели на теста
Използвана бе извадка 5600 ученици – по 200 ученици от регион. Размерът на извадката позволява да се работи с пределно допустима грешка от 1,2% на 50% дял в рамките на страната (цялата популация), а на ниво регион – 5,82% на 77% дял (средният дял или трудност на теста) при доверителна вероятност 95%.
Тежестта на един ученик е различна за всеки регион и варира от 4 (Видин) до 45 (София-град).
Основните резултати и психометричните показатели на теста са посочени в таблица 2.
Таблица 2. Основни резултати и психометрични показатели на теста
Резултатите показват много добра надеждност на теста за практически цели (Алфа=0,82). Тя позволява да се извършват сравнения на резултатите по групи (пол, възраст, региони и т. н.). (Замфиров, 2011)
Стандартната грешка на измерването показва с колко точки трябва да се различават два резултата от теста, за да бъдат статистически значимо различни. В нашия случай това са 1,41 точки. (Замфиров, 2006).
58 ученици, или 0,1% не са решили нито една въпрос (фиг. 1).
Фиг. 1. Процентно разпределение на точките
Очакваният брой вярно решени въпроси при използване на стратегията на налучкване е 7 (6,67) въпроса. Същия и по нисък резултат показват 3,7% от учениците (2 139).
Психометричните данни на отделните въпроси са посочени в следващата таблица (табл. 3):
Таблица № 3. Базови психометрични показатели на айтемите (въпросите) на теста
Три от въпросите в теста имат 90 и повече процента верни отговори — № 3 (Събиране на естествени числа с преминаване), № 2 (Нареждане на естествени числа) и № 4 (Изваждане на естествени числа с преминаване):
Средно трудни са два от въпросите в теста — № 20 (Описване на реални ситуации с математически модел, вкл. обиколки и лица на фигури) и № 16 (Намиране на дължините на страните на квадрат и правоъгълник върху квадратна мрежа със зададена единица мярка върху мрежата):
Следва да се отбележи, че както въпросите, които имат 90 и повече процента верни отговори, така и средно трудните, са от познавателното равнище Използване на алгоритми и само въпрос № 20 обхваща и второ познавателно равнище Разбиране и приложение.
В следващата таблица (табл. 4) е направен анализ на резултатите от теста спрямо спецификацията.
Таблица 4. Анализ на резултатите от теста спрямо спецификацията
Задачите от познавателно равнище „Използване на алгоритъм“ правят скала с надеждност, позволяваща използването самостоятелно. В този смисъл резултатите от нея може да се ползват за изводи не само за популацията като цяло, но и за отделни подгрупи в нея.
Останалите две субскали („Познаване на факти“ и „Разбиране и приложение“) имат недостатъчна надеждност, за да бъдат използвани самостоятелно. Причината за това може да бъде малкият брой задачи в тях. Коефициентът на Spearmen-Brown показва, че скалата „Познаване на факти” би трябвало да има 11 въпроса, за да стигне надеждност, равна на 0,65. За субскалата „Разбиране и приложение“ за същата надеждност (0,65) въпросите би трябвало да бъдат 6. Тези субскали не може да бъдат представяни обобщено чрез сумата на точките от въпросите, които ги съставят, но анализът им може да се прави задача по задача.
Сравняване на резултатите на регионите със средното за страната
Резултатите по региони спрямо средното за страната бяха обособени до 3 групи (табл. 5): „средно”, „под средно” (обхваща 33,3% от учениците с най-ниски резултати) и „над средно” (обхваща учениците с най-висок брой точки).
Таблица 5. Подреждане на регионите според средния резултат за страната
За сравняване на резултатите на даден регион, община или училище със средните резултати за страната се използва следната скала:
до 14,02 точки – постижения под средното за страната;
14,06 – 14,83 точки – средни постижения;
15,00 – 20 точки – постижения над средното за страната.
Влияние на пола
Проверката за влиянието на пола по региони не показа статистически значими разлики (табл. 6).
Таблица № 6. Психометрични характеристики на теста за групата на момчетата и момичетата
Разликата е незначима (в рамките на стандартната грешка на измерването).
Влияние на най-често говоримия език в семейството
Вижда се, че усвояването на знанията и уменията, измервани с теста, не е затруднило групата, говореща български език – средната трудност е над 78% (табл. 7)
Таблица № 7. Психометрични характеристики на теста според най-често говоримия език в семейството
Значима е разликата между резултатите на групата, говореща български и ромски – разликата е 4,66 точки (два пъти по голяма от грешката на измерване).
Изводи
От процентното разпределение на верните отговори може да направим следните изводи:
• Средният тестов бал е висок – 14,97 т., което показва, че учениците се справят успешно с 66,3% от проверяваното учебно съдържание.
• Медианата е 16,0 точки, т.е. 50% от учениците имат повече от 16 точки (80% от проверяваното учебно съдържание).
• Модата (балът с най-висока честота – 8262 ученици –14,3%) е 20 т. и съвпада с максималния възможнен резултат.
• Усвояването на материала, застъпен в теста, не е било прекалено трудно за нито една от групите (среден брой верни отговори под 20%).
• Тестът не е затруднил групата, говореща български език. Тя владее средно 78,7% от проверявания материал.
• Групата, говореща турски език, владее средно 64.29% от проверявания материал.
• Групата, говореща ромски език, владее средно 55.41% от проверявания материал.
• Наблюдава се статистически значима разлика между групата, говореща български, и тази, говореща ромски език (4,66 точки).
• Наблюдава се тенденция към значима разлика между групата, говореща български, и тази, говореща турски език (2,88 точки).
Заключение
Правейки сравнение с резултатите от 2011 г., можем да направим заключението, че всички въпроси от теста са с достатъчно добра дискриминативна сила.
Същевременно се отчита затвърждаване на тенденция към значима разлика между групата, говореща български, и тази, говореща турски език. За 2011 г. тя е била 2,67 точки, а за 2012 г. е 2,88 точки.
Отчита се, че статистически значимата разлика между групата, говореща български, и тази, говореща ромски език, остава – за 2011 г. тя е била 4,16 точки, а за 2012 г. е 4,66 точки.
И за двете години тестът не е затруднил групата, говореща български език – за 2011 г. владее средно 78,23% от проверявания материал, а за 2012 г. владее 78,7%.
Същото важи и за групата, говореща турски език – тя владее средно 64.29% от проверявания материал за 2012 г. и 64,88% от проверявания материал за 2011 г.
Не така стои въпросът с групата, говореща ромски език – тя владее средно 55.41% от проверявания материал за 2012 г. срещу 57,47% за 2011 г., т.е. отчита се над 2% разлика.
В тази връзка е добре ангажираните образователни власти – регионалните инспекторати и МОМН – да обърнат повече внимание на училищата с преобладаващо ромски ученици с цел подпомагане на работата на учителите в съответните региони и училища.
Благодарности
Авторът изразява своята голяма благодарност на г-жа Н. Кристанова – директор на Центъра за контрол и оценка на качеството на училищното образование, и на проф. К. Банков – ръководител на катедра „Обучение по математика и информатика“, СУ „Св. Климент Охридски“.
ЛИТЕРАТУРА
Банков, К. и Витанов, Т. (2006) Анализ на резултатите от апробация на стратегия за външно оценяване на ДОИ за УС по математика за четвърти клас, Варна, май 2005. Математика и математическо образование – тридесет и пета пролетна конференция на СМБ.
Замфиров, М. (2006). Статистически анализ на степента на усвояемост на учебен материал в културнообразователната област „Природни науки и екология“ V– VIII клас от ученици със слухови нарушения в специализирани училища в България и Унгария. Специална педагогика, 4, 74–84.
Замфиров, М. (2011). Резултати от външното оценяване по „Човекът и природата“ в четвърти клас за 2011 г. Биология, екология, Биотехнологии, 6, 26–36.
Замфиров, М. (2012). За връзката между резултатите на учениците по „Човекът и природата“ и „Математика“ от външното оценяване през 2011 г. Светът на физиката, 1, 78–92