Ефективност на обучението
ДИАГНОСТИКА НА ЕКОЛОГИЧНАТА КУЛТУРА НА УЧЕНИЦИТЕ ПРИ ИЗУЧАВАНЕ НА VI-А ГРУПА НА ПЕРИОДИЧНАТА ТАБЛИЦА В 8. КЛАС
Резюме. В статията са представени резултатите от статистическото изследване на качествата на критериален тест „VI-Aгрупа на Периодичната таблица и опазване на околната среда“. Анализът на тестовите задачи е осъществен в следните аспекти: (а) априорен анализ – реализиран чрез метода на експертната оценка; (б) апостериорен анализ – чрез статистическа обработка на резултатите от апробирането на теста в представителна извадка от ученици в 8. клас. Емпиричните данни показват, че тестът притежава добри статистически характеристики и може да служи за ефективна диагностика на екологичната култура на учениците. Тестът е използван като основно диагностично средство в организираното експериментално обучение, което има за цел да провери целесъобразността на разработената дидактическа технология за обогатяване на екологичната култура на учениците при изучаване на VI-A група на Периодичната таблица в 8. клас.
Ключови думи: ecological culture, didactical tools, chemistry education, environmental education
Увод
В предишна публикация (Angelacheva & Gergova, 2013) са представени познавателните цели, структурата и съдържанието на критериален тест „VI-А група на Периодичната таблица и опазване на околната среда“, съставен върху общозадължителното учебно съдържание по „Химия и опазване на околната среда“ в 8. клас. За да може конструираният тест да служи за ефективна диагностика на екологичната култура на учениците, той трябва да притежава добри статистически характеристики.
Настоящата статия представя резултатите от статистическия анализ при изследване на качествата на разработения тест и при неговото приложение в процеса на обучение по химия в 8. клас.
Методология на изследването
Целта на статистическото изследване е да се получат достоверни данни за качествата на критериален тест „VI-А група на Периодичната система и опазване на околната среда“. Въз основа на получените резултати да се достигне до обосновано решение за използването на теста като надежден инструмент за диагностика на продуктивността на учебната дейност, свързана с екологичните знания и ценностните отношения на учениците към околната среда в 8. клас.
Дефинираната цел ориентира към решаването на следните задачи: (а) осъществяване на априорен анализ чрез метода на експертната оценка; (б) реализиране на апостериорен анализ чрез статистическа обработка на резултатите от изпробването на теста в представителна извадка от ученици в 8. клас; (в) използване на теста за диагностика на екологичната култура на учениците в специално организираното експериментално обучение.
Резултати и обсъждане
Априорният анализ е извършен от 10 експерти - учители по химия с висока педагогическа квалификация. Експертите оценяват качествата на теста по показатели, необходими за определяне на неговата съдържателна валидност, надеждността на предложената от авторите система за оценяване на резултатите от теста и стандарта за успешност на теста.
Показател за съдържателната валидност на теста е съответствието между всяка от задачите в него и познавателните цели, чието постигане той е предназначен да диагностицира (Бижков, 1996). Това съответствие се оценява от експертите по следната скала: +1 - задачата съответства на дадена цел/цели; 0 - не може да се прецени категорично дали задачата съответства на дадена учебна цел; -1 - задачата не отговаря на нито една цел (познавателните цели на теста са представени oт Agelacheva & Gergova (2013)). Количествен израз на разглеждания показател е коефициентът на съответствие CVR [формула (1), Бижков (1996)].
(1) \[ \mathrm{CVR}=\tfrac{\mathrm{n}_{\mathrm{e}}-\mathrm{N} / 2}{\mathrm{~N} / 2} \]
където \(n_{e}\) е броят на експертите, които оценяват положително задачата от теста, а N е общият брой на експертите.
След заместване на данните от експертните оценки във формула (1) получените числови стойности на коефициента CVR показват, че съдържателната валидност на отделните задачи и на теста като цяло е добра (таблица 1 в Приложение).
Надеждността на предложената от авторите система, чрез която се оценяват постиженията на учениците и се формира общият тестови бал, е определена от експертите по познатата скала: +1 - отразява съгласието на всеки от експертите с оценката на автора; 0 – колебание дали оценката на автора е коректна; –1 – несъгласие с оценката на автора. При отговор –1 е необходимо експертът да предложи оценка, която счита за коректна. Отговорите на експертите са отразени в таблица 2, Приложение.
Обсъжданият показател се представя количествено с коефициента на съгласие РА (percentage agreement), който показва какъв процент от експертите поддържат сходна оценка относно дадена категория спрямо общия брой оценки [формула (2); Стоянова (1996)]:
(2) \[ \text { РА }=\tfrac{\text { брой съгласия }}{\text { брой съгласия + брой несъгласия }} \]
където съгласието означава оценка \((+1)\) на експерта, а несъгласието – оценка \((0)\) или \((-1)\).
Границите, в които варира коефициентът РА, са между \(70 \%\) и \(100 \%\). След заместване на данните от експертните оценки във формула (2) получените числови стойности на РА (таблица 2, Приложение) дават основание да се твърди, че надеждността на предложената от авторите оценъчна система е добра.
Чрез експертна оценка е определен и стандартът (критерият) за успешност U, който дава отговор на въпроса: колко от задачите в субтеста и в теста като цяло трябва да бъдат решени, за да се счита, че са постигнати целите на субтеста (респективно на теста).
За да се прецени какъв трябва да бъде минималният брой (\(\mathrm{N}_{\min }\) ) вярно решени задачи от ученика при тест с дължина (N), експертите използват данни от таблицата на К. Клауер (Бижков, 1996), според която: (а) при \(\mathrm{N}=6\) минимумът вярно решени задачи трябва да \(\mathrm{N}_{\min }=4\); (б) при \(\mathrm{N}=12\) минимумът вярно решени задачи трябва да \(\mathrm{N}_{\text {min }}=9\) (при вероятност за грешка \(\mathrm{p}=0,95\) и р равнище на достоверност \(\alpha=0,01\) ).
Експертите сравняват предложените от К. Клауер стандарти за успешност U с конкретния тест. Според 9 от общо 10 експерти, участвали в оценката на теста, за да се приеме, че неговите цели са постигнати, трябва да бъдат решени най-малко 9 от общо 12 задачи, т.е. \(U(\) тест \()=9 ; U(\) субтест 1\()=4 ; U(\) субтест 2\()=4\).
Апостериорният анализ на теста е осъществен след неговото апробиране в извадка от 60 ученици в 8. клас. Получените данни и тяхната статистическа обработка са необходими за: определяне на трудността и на дискриминативната сила на задачите от теста; анализ на дистракторите (неверните отговори); установяване на надеждността и на критериалната валидност на теста.
Трудността на задачите от критериално ориентиран тест е пряка функция на целите, за измерването на които той е конструиран. Трудността на тестовите задачи се представя чрез индекса на трудност Р, който показва процентната част на тестираните лица, които са постигнали поставената цел(и) при решаването на съответната задача, и се изчислява по формула (3) (Бижков, 1996):
(3) \[ \mathrm{P}=\tfrac{\mathrm{N}_{\mathrm{R}}}{\mathrm{~N}} \cdot 100 \]
където \(\mathrm{N}_{\mathrm{R}}\) e броят на учениците от изследваната група, които вярно са решили задачата и така са постигнали поставената цел, а N e общият брой на учениците от групата.
Тест, конструиран от задачи с изборен отговор (1 от 5), където вероятността за налучкване на верния отговор е малка, трябва да има средна трудност около \(70 \%\) (Бижков, 1996). Следователно за тест, който се състои от 12 задачи, средният брой вярно решени задачи от ученик трябва да е \(8-9\) задачи.
След заместване на емпиричните данни във формула (3) получените стойности на индекса на трудност Р (вж. таблица 3, Приложение) са в допустимите граници (около 70%), т.е. тестовите задачи са с добри показатели по отношение на изследваното качество.
Дискриминативната сила показва възможността дадена задача да разграничи учениците, които са постигнали учебната цел, от тези, които не са успели. Определя се чрез метода на контрастните групи („силна“ и „слаба“ група), образувани въз основа на стандарта за успешност на теста. „Силната“ група включва ученици, които са постигнали целите на теста; „слабата“ група - ученици, които са решили по-малко от 9 задачи. Дискриминативната сила се изчислява по формула (4) (Бижков, 1996):
(4) \[ \mathrm{BI}=\tfrac{\mathrm{V}_{1}}{\mathrm{~N}_{1}}-\tfrac{\mathrm{V}_{2}}{\mathrm{~N}_{2}} \]
Където \(V_{1}, V_{2}\)– брой на учениците, съответно от „силната“ и „слабата“ група, с вярно решение на задачата, \(\mathrm{a} \mathrm{N}_{1}, \mathrm{~N}_{2}\)– общият брой ученици в тези групи (\(\mathrm{N}_{1}=\mathrm{N}_{2}=60\) ).
Според Р. Ебел приемливият от практическа гледна точка индекс на дискриминативната сила е между 0,40 и 0,60 (Бижков, 1996). Данните в таблица 3 (Приложение) показват, че индексите на дискриминативната сила на тестовите задачи са над 0,40. Следователно задачите от конструирания тест позволяват да се различат учениците, които са постигнали целите на теста, от тези, които не са ги постигнали.
При задачи с изборен отговор анализът на дистракторите е необходим, за да се установи дали и в каква степен те са приемливи за учениците и доколко позволяват да се разграничат „силните“ от „слабите“ ученици. Данните от тестирането показват, че тестовите задачи отговарят на определените от Р. Брек основни изисквания при анализа на дистракторите (Бижков, 1996): (а) всеки от дистракторите е посочен от повече „слаби“ ученици, отколкото „силни“; (б) всеки дистрактор е посочен също така от поне няколко от „силните“ ученици; (в) в групата на „силните“ ученици нито един от дистракторите не е посочен от повече ученици, отколкото верния отговор.
Надеждността на критериалния тест се определя от трайността на резултатите от две последователни тестирания (тест Т / ретест РТ) . За анализ на надеждността се използват алтернативни признаци, тъй като от експертната оценка на теста е изведен конкретен стандарт за успешност (9 вярно решени задачи). По него учениците могат да се разграничат на „постигнали“ и „непостигнали“ целите на теста при неговото повторение.
Количествено надеждността се представя с коефициента на корелачия \(\phi\), който показва дали съществува зависимост между резултатите от двукратното тестиране и описва силата на тази зависимост. Той приема стойности от 0 до 1 и колкото по-високи са тези стойности, толкова по-надежден е конкретният тест. Коефициентът f се изчислява по формула (5) (Бижков, 1996):
(5) \[ \phi=\sqrt{\tfrac{\chi^{2}}{n}} \]
Където n е броят на учениците в извадката, a \(\chi^{2}\) е критерий, който показва дали съществува статистически значима корелация между резултатите от първото и от второто тестиране. Този критерий се изчислява по формула (6) (Бижков, 1996):
(6) \[ \chi^{2}=\tfrac{(\mathrm{ad}-\mathrm{bc})^{2} \cdot \mathrm{n}}{(\mathrm{a}+\mathrm{b}) \cdot(\mathrm{c}+\mathrm{d}) \cdot(\mathrm{a}+\mathrm{c}) \cdot(\mathrm{b}+\mathrm{d})} \]
Във формула (6) a и d отразяват броя на случаите, притежаващи или непритежаващи изследваните признаци (постигнали, респективно непостигнали целите при теста и при ретеста), b и с - броя на случаите, при които се притежава единият, но не се притежава другият признак (постигнали целите на теста, но непостигнали целите на ретеста или обратно).
За да се определи коефициентът на корелация \(\phi\), е необходимо резултатите от двукратното тестиране да се представят в таблица с четири полета (Таблица 1).
Таблица 1. Трайност на резултатите от теста
От данните в таблица 1 може да се твърди, че надеждността на съставения тест е приемлива, тъй като съществува статистически значима корелация между резултатите от теста и ретеста (изчислената стойност на коефициента \(\chi^{2}\) е по-голяма от критичната стойност \(\chi^{2}{ }_{0,01 / 1}=6,64\) ), а стойността на коефициента \(\phi\) е висока (\(\phi=0,7\) ).
Критериалната валидност на теста (степента на съответствие на теста и предварително определен критерий) е анализирана по отношение на: (а) вътрешната критериална валидност (сравняване на резултатите от двата субтеста и резултатите от целия тест); (б) външната критериална валидност (сравняване на резултатите от теста „VI-А група на Периодичната таблица и опазване на околната среда“ с резултатите от друг критериален тест, който измерва същата зависима променлива).
За определяне на критериалната валидност в откроените два аспекта са използвани коефициентът на корелация \(\phi\) [формула (5)] и вътрешно специфичният коефициент на асочиация \(\phi_{\text {кор. }}\) (формула (7); Клаус & Ебнер, 1971), чрез който се оценява степента на зависимост между променливите величини.
(7) \[ \phi_{\text {кор. }}=\tfrac{\mathrm{bc}-\mathrm{ad}}{\mathrm{n} \cdot \min (\mathrm{~b}, \mathrm{c})-(\mathrm{bc}-\mathrm{ad})} \]
където n - брой на учениците в извадката; \(\mathrm{a}, \mathrm{d}\)- отразяват броя на случаите, които притежават или не притежават изследваните признаци (постигнали или непостигнали целите на теста); \(\mathrm{b}, \mathrm{c}\)- отразяват броя на случаите, които притежават единия признак, но не притежават другия.
Прилагането на коефициентите \(\phi, \phi_{\text {кор. }}\) и к критерия \(\chi^{2}\) при изследване на \(в\) ътрешната критериална валидност на теста изисква резултатите от субтест 1, от субтест 2 и от теста да се представят в таблици с четири полета (таблици 2, и 3).
Таблица 2. Корелация между резултатите от субтест 1 и от теста като цяло
Таблица 3. Корелация между резултатите от субтест 2 и от теста като цяло
Статистическата обработка на резултатите, отразени в таблици 2 и 3, е необходима за проверка на статистическите хипотези:
\(\mathbf{H}_{0}: \mathrm{p}_{1}=\mathrm{p}_{2}\) не съществува зависимост между резултатите от двата субтеста и общия резултат от теста.
\(\mathbf{H}_{1}: \mathrm{p}_{1} \quad \mathrm{p}_{2}\) съществува зависимост между резултатите от двата субтеста и общия резултат от теста.
Приложените статистически процедури и получените от тях данни (таблици 2 и 3) показват, че стойностите на критерия \(\chi^{2}\) са по-високи от критичната стойност \(\chi^{2}{ }_{0,01 / 1}=6,64\), а абсолютните стойности на коефициента \(\phi_{\text {кор. }}\) са по-високи от 0,5. Следователно може да се приеме алтернативната хипотеза \(\mathrm{H}_{1}\), т.е. вътрешната критериална валидност на теста е емпирично доказана.
За установяване на външната критериална валидност резултатите от теста „VI-А група на Периодичната система и опазване на околната среда“ (тест 1) се сравняват с резултатите от тест „V-А група на Периодичната таблица и опазване на околната среда“ (тест 2) (Ангелачева \(\&\) Гергова, 2003). Използват се същите статистически величини и процедури както при оценката на вътрешната критериална валидност (таблица 4).
Таблица 4. Корелация между резултатите от тест 1 и от тест 2
Данните от таблица 4 са необходими за проверка на статистическите хипотези:
\(\mathbf{H}_{0}: \mathrm{p}_{1}=\mathrm{p}_{2}\) не съществува зависимост между резултатите от двата теста в двете извадки.
\(\mathbf{H}_{1}: \mathrm{p}_{1} \quad \mathrm{p}_{2}\) съществува зависимост между резултатите от двата теста в двете извадки.
Тъй като емпиричните стойности на критерия \(\chi^{2}\) са по-високи от стойността на \(\chi^{2}{ }_{0,01 / 1}=6,64\), а абсолютните стойности на \(\phi_{\text {кор. }}\) са по-високи от 0,5, се приема алтернативната хипотеза \(\mathrm{H}_{1}\), т.е. съществува значителна корелация между резултатите от тест 1 и тест 2. Следователно може да се твърди, че външната критериална валидност на теста е доказана.
Резултатите от априорния и от апостериорния анализ показват, че качествата на теста удовлетворяват описаните в литературата основни изисквания към критериалните тестове (Иванов, 1999; Наследов, 2012; Стойчев, 2007). Следователно той може ефективно да се използва за диагностика на екологичната култура на учениците при изучаване на VІ-А група в 8. клас.
Създаденият тест е използван като основен диагностичен инструмент за измерване на резултатите от организираното експериментално обучение. То има за цел да провери целесъобразността на разработената дидактическа технология за обогатяване на екологичната култура на учениците при изучаване на посоченото учебно съдържание. Обучението е осъществено с две групи ученици: експериментална група (обучава се по създадения технологичен вариант, който ще бъде представен в следваща публикация) и контролна група (обучава се по общоприетата учебна програма). Групите са изравнени по признака успеваемост по химия чрез резултатите от входящ тест „Химични елементи от ІІ-А група“. На случаен принцип от двете групи са избрани по 30 ученици с добър и 30 ученици с много добър успех, които са постигнали на входящия тест. След обучението в раздела за VІ-А група е проведено изходящо тестиране с цел диагностика на екологичната култура на учениците (използван е критериалният тест „VI-А група на Периодичната система и опазване на околната среда“). Резултатите от тестирането са представени в таблица 5.
Таблица 5. Резултати от теста в контролната група (КГ) и в експерименталната група (ЕГ)
Непрекъснатият характер на белега (продуктивност на ученето по химия с акцент върху екологичната култура на учениците) мотивира избора на статистическите параметри: средноаритметична \(\overline{\mathrm{x}}\), дисперсия \(\mathrm{s}^{2}\), стандартно отклонение s (Генкова & Найденова, 2003; Димитрова, 2006; Лакюрски, 1999) (таблица 6).
Таблица 6. Статистически величини, които характеризират продуктивността на ученето в изследваните групи
Съществен за изследването е проблемът: различават ли се разпределенията на случайните величини Х и Y, характеризиращи продуктивността на ученето по химия, в експерименталната и в контролната група?
\(\mathbf{H}_{0}\) : Разликата между разпределенията на случайните величини Х и Y в изследваните групи е несъществена и се дължи само на случайни фактори.
\(\mathbf{H}_{1}\) : Между разпределенията на случайните величини Х и Y в изследваните групи съществува значима разлика, която изключва влиянието на случайни фактори.
Статистическите хипотези се изследват с непараметрични методи, които не са свързани с формата на разпределение на измерените величини (Иванов, 1999). Приложен е еднофакторен дисперсионен анализ, тъй като се проследява въздействието на един комплексен фактор (конструираната дидактическа технология за обогатяване на екологичната култура на учениците) върху резултативната променлива (продуктивността на ученето по химия с акцент върху екологичната култура на учениците). За да се установи дали този фактор предизвиква систематична вариация в разпределението на случайните величини Х и Y, отразяващи продуктивността на учене в групите, обучавани по различните варианти, е необходимо да се провери наличието или отсъствието на разлика между средните параметри на резултативния признак в извадките. Ако разликата е статистически значима, то вариацията, предизвикана от съвкупното влияние на фактора, има системен, закономерен характер.
Прилагането на еднофакторен дисперсионен анализ изисква експерименталните данни да са получени от независими случайни извадки, принадлежащи към генерални съвкупности с еднаква дисперсия (Клаус & Ебнер, 1971). Дали е изпълнено това условие, може да се провери с теста на Бартлет. Статистическите хипотези са:
\(\mathbf{H}_{0}: \mathrm{s}_{1}{ }^{2}=\mathrm{s}_{2}{ }^{2} \quad\) няма разлика между дисперсиите в двете извадки;
\(\mathbf{H}_{1}: \mathrm{s}_{1}{ }^{2} \neq \mathrm{s}_{2}{ }^{2} \quad\) дисперсиите в двете извадки се различават.
При избрано равнище на достоверност \(\alpha=0,01\) експерименталните данни, необходими за теста на Бартлет, са представени в таблица 7.
Означения: \(\overline{\mathrm{x}}\)-средноаритметична стойност на извадката; \(\sum_{\mathrm{i}=1}^{60} \mathrm{x}_{\mathrm{ij}}^{2}\)-сума от квадратите на бала на всички членове на извадката; \(\mathrm{s}_{\mathrm{i}}\)-сума от \(\mathrm{x}_{\mathrm{ij}}\) в извадката; \(\mathrm{s}_{\mathrm{i}}^{2}\)дисперсия на групата.
Таблица 7. Данни за теста на Бартлет
Дисперсиите \(s_{i}^{2}\) и претеглената средна величина от дисперсиите \(s^{2}\) се изчисляват по формули (8) и (9) (Клаус & Ебнер, 1971):
(8) \[ s_{i}^{2}=\tfrac{1}{n_{i}-1}\left(\sum_{i=1}^{60} x_{i j}^{2}-\tfrac{S_{i}^{2}}{n_{i}}\right) \]
където \(\mathrm{n}_{\mathrm{i}}=60\) е обемът на извадката.
(9) \[ s^{2}=\tfrac{1}{N-k} \sum_{i=1}^{k}\left(\sum_{i=1}^{60} x_{i j}^{2}-\tfrac{S_{i}^{2}}{n_{i}}\right) \]
където N е обемът на извадките, а k е броят на извадките.
След заместване на данните във формула (9) се получава: за субтест \(1 \mathrm{~s}^{2}=0,9117\) \(\Rightarrow \lg \mathrm{s}^{2}=-0,0402\); за субтест \(2 \quad \mathrm{~s}^{2}=1,1285 \Rightarrow \lg \mathrm{~s}^{2}=0,0525\).
В теста на Бартлет проверяващата величина е критерият \(\chi^{2}\), който се изчислява по формула (10) (Клаус & Ебнер, 1971):
(10) \[ \chi^{2}=\tfrac{2,3026}{c} k(n-1)\left(\lg s^{2}-\tfrac{1}{k} \sum_{i=1}^{k} \lg s_{i}^{2}\right) \]
където \(\mathrm{c}=1+\tfrac{\mathrm{k}+1}{3 \mathrm{k}(\mathrm{n}-1)}=1+\tfrac{2+1}{3.2(60-1)}=1,0085\).
След заместване във формула (10) се получава: за субтест \(1 \chi^{2}=0,27\); за субтест \(2 \chi^{2}=0,62\).
Получените стойности на \(\chi^{2}\) се сравняват с критичната стойност \(\chi_{0,01 / 1}^{2}=6,64\).
Тъй като и за двата субтеста \(\chi^{2} \ll \chi_{0,01 / 1}^{2}\), може да се приеме нулевата хипотеза \(\mathrm{H}_{0}\), т.е. няма разлика между дисперсиите на контролната и на експерименталната група.
След като с теста на Бартлет е доказано условието за еднаква дисперсия в двете групи, може да се приложи еднофакторен дисперсионен анализ при независими извадки с равен обем (\(\mathrm{n}_{1}=\mathrm{n}_{2}=60\) ) и избрано равнище на достоверност \(\alpha=0,01\) (Клаус & Ебнер, 1971). Статистическите хипотези са:
\(\mathbf{H}_{0}: \mu_{1}=\mu_{2}\) няма разлика между средноаритметичните величини в двете извадки;
\(\mathbf{H}_{1}: \mu_{1} \quad \mu_{2} \quad\) средноаритметичните величини в двете извадки се различават.
Формулите и изчисленията за дисперсионния анализ са представени в таблица 8. където \(\mathrm{CK}_{\mathrm{M}}\) е среден квадрат между групите, а \(\mathrm{CK}_{\text {гр. }}\) е среден квадрат по групи.
Таблица 8. Таблица на дисперсионния анализ
След заместване на данните във формула (11) се получава: за субтест \(1 \mathrm{~F}=\) 21,99; за субтест \(2 \mathrm{~F}=9,57\).
Получените стойности на F се сравняват с критичната стойност \(\mathrm{F}_{0,01 ; 1 / 118}=6,84\).
Тъй като и за двата субтеста \(\mathrm{F} \gt \mathrm{F}_{0,01 ; 1 / 18}\), нулевата хипотеза \(\mathrm{H}_{0}\) се отхвърля. Следователно може да се приеме алтернативната хипотеза \(\mathrm{H}_{1}\) : средните параметри на на двете изследвани групи се различават.
С отхвърлянето на нулевата хипотеза възниква въпросът за оценка на значимостта на разликата между средните величини на сравняваните извадки. Използва се тестът на Данкън, при който статистически критерий е значимият вариационен интервал \(\mathrm{R}_{\mathrm{p}}\) (формула (12); Клаус & Ебнер (1971):
(12) \[ \mathrm{R}_{\mathrm{p}}=\mathrm{q}_{\alpha}(\mathrm{p} ; \mathrm{N}-\mathrm{k}) \cdot \mathrm{S}_{\overline{\mathrm{x}}} \]
където \(\mathrm{S}_{-\mathrm{x}}\) е стандартното отклонение и се изчислява по формула (13); Клаус & Ебнер, (1971):
(13) \[ S_{-}=\sqrt{\tfrac{C K_{r p .}}{n}} \]
Разликата между средните величини на двете извадки се сравнява с вариационния интервал \(\mathrm{R}_{\mathrm{p}}\). При това: (а) ако \(\overline{\mathrm{X}}_{1}-\overline{\mathrm{X}}_{2} \lt \mathrm{R}_{\mathrm{p}}\), разликата между средните величини не е значима; (б) ако \(\overline{\mathrm{X}}_{1}-\overline{\mathrm{X}}_{2} \gt \mathrm{R}_{\mathrm{p}}\), разликата между средните величини е значима.
В нашия случай разликата между средните величини е: за субтест \(1 \bar{x}_{1}-\bar{x}_{2}=\) 0,82; за субтест \(2 \overline{\mathrm{x}}_{1}-\overline{\mathrm{x}}_{2}=0,6\).
При \(\mathrm{p}=2\) стойността на \(\mathrm{q}_{0,01}(2 ; 118)\) е 3,702 (Клаус & Ебнер, 1971).
След заместване на данните във формули (12) и (13) се получава: за субтест 1 \(\mathrm{S}_{\overline{\mathrm{x}}}=0,1232 ; \mathrm{R}_{\mathrm{p}}=0,4561 \lt 0,82 ;\) за субтест \(2 \mathrm{~S}_{\overline{\mathrm{x}}}=0,1372 ; \mathrm{R}_{\mathrm{p}}=0,5080 \lt 0,6\).
Тъй като за двата субтеста разликата между средните величини \(\bar{x}_{1}-\bar{x}_{2} \gt \mathrm{R}_{\mathrm{p}}\), нулевата хипотеза \(\mathrm{H}_{0}\) се отхвърля и се приема алтернативната хипотеза \(\mathrm{H}_{1}\) : разликата между средноаритметичните величини на двете групи е значима, т.е. резултатите на експерименталната група превъзхождат тези на контролната група. Следователно тестът не само доказва по-добрия ефект на разработената дидактическа технология в експерименталната група, но той може да служи и за диагностика на продуктивността на ученето по химия с акцент върху екологичната култура на учениците.
Таблица 9. Корелация между резултатите от субтест 1 и от субтест 2 за контролната група
Таблица 10. Корелация между резултатите от субтест 1 и от субтест 2 за експерименталната група
Интересен за нас е проблемът за трудността на задачите от двата субтеста съответно за експерименталната и за контролната група. Решението на този проблем може да открои по-силно разликата между двата варианта на обучение.
Критерият на Макнамара е разработен специално за сравняване на резултатите на две зависими извадки, с две категории на измерване на изучаваното свойство, при което двойките на случайните величини X и Y са взаимно независими (Грабарь \(\&\) Краснянская, 1977; Клаус & Ебнер, 1971).
За да се използва този критерий, е необходимо данните за изследваните групи да се представят във вид на четириклетъчни таблици „ \(2 \times 2\)"за две серии наблюдения на променливите X и Y, характеризиращи продуктивността на учене по химия от двата субтеста (таблици 9 и 10).
Статистическите хипотези имат вида:
\(\mathbf{H}_{0}: \mathrm{p}\left(\mathrm{x}_{\mathrm{i}}=0, \mathrm{y}_{\mathrm{i}}=1\right)=\mathrm{p}\left(\mathrm{x}_{\mathrm{i}}=1, \mathrm{y}_{\mathrm{i}}=0\right)\) субтест 1 и субтест 2 са с еднаква трудност;
\(\mathbf{H}_{1}: \mathrm{p}\left(\mathrm{x}_{\mathrm{i}}=0, \mathrm{y}_{\mathrm{i}}=1\right) \neq \mathrm{p}\left(\mathrm{x}_{\mathrm{i}}=1, \mathrm{y}_{\mathrm{i}}=0\right)\) субтест 1: p (xi ¹ p 0) субтест 1 и субтест 2 не са с еднаква трудност.
При \(\mathrm{n}=\mathrm{b}+\mathrm{c} \lt 20\) като проверяваща величина се използва статистиката на критерия \(\mathrm{T}_{2}\). Тя се изчислява по формула (14) (Грабарь & Краснянская, 1977): \(\mathrm{T}_{2}\) \(=\min (\mathrm{b}, \mathrm{c})\).
От таблица за вероятностите р за биноминално разпределение при \(\mathrm{p}=0,5\) се намират стойностите на р за експерименталнатите на \(p\) за експерименталната и за контролната група (Грабарь \(\&\) Краснянская, 1977): при \(\alpha=0,01, \mathrm{n}(К Г)=16, \mathrm{~T}_{2}(К Г)=2\) и \(\mathrm{p}(К Г)=0,002\); при \(\alpha=0,01, \mathrm{n}(\mathrm{E} \Gamma)=12, \mathrm{~T}_{2}(\mathrm{E} \Gamma)=3\) и \(\mathrm{p}(\mathrm{E} \Gamma)=0,073\).
Табличните стойности на р се сравняват със стойността на \(\alpha / 2\). При това: (а) ако \(\mathrm{p} \lt \alpha / 2\), нулевата хипотеза \(\mathbf{H}_{0}\) се отхвърля; (б) ако \(\mathrm{p} \gt \alpha / 2\), нулевата хипотеза \(\mathbf{H}_{0}\) се приема.
За контролната група \(\mathrm{p}=0,002 \lt \alpha / 2\). Следователно \(\mathbf{H}_{0}\) се отхвърля и се приема алтернативната хипотеза \(\mathbf{H}_{1}\) за разлика в трудността на задачите от двата субтеста.
За експерименталната група \(\mathrm{p}=0,073 \gt \alpha / 2\). Следователно се приема нулевата хипотеза \(\mathbf{H}_{\mathbf{0}}\), т.е. за тази група ученици задачите от двата субтеста се възприемат като задачи с еднаква трудност.
Резултатите от тестирането показват, че в експерименталаната група разработената технология създава добри условия за продуктивно учене по критериите приложимост на екологичните знания в различни ситуации и проявено отношение към екологичните проблеми в рамките на учебния материал за VI-А група на Периодичната таблица.
Заключение
В заключение може да се отбележи: (а) качествата на тестовите задачи и на теста като цяло отговарят на описаните в литературата основни изисквания към критериалните тестове; (б) конструираният вариант на критериален тест може ефективно да изпълнява ролята на инструментариум за диагностика на екологичната култура на учениците (на системата от екологични знания и ценностни отношения към околната среда) при изучаване на VI-A група на Периодичната таблица в 8. клас; (в) подобни диагностични средства могат да бъдат създадени в рамките и на други теми от учебното съдържание по химия, тъй като целенасоченото формиране и диагностика на екологична култура на учениците, която е неотменима част от общата култура на личността, следва да бъде специална задача на обучението по химия в училище.
ПРИЛОЖЕНИЕ
Таблица 1. Оценка на експертите за съответствието между тестовите задачи и познавателните цели, които тестът се стреми да реализира
Таблица 2. Оценка на експертите за авторовата оценка на отговорите на тестовите задачи
Таблица 3. Трудност и дискриминативна сила на задачите от теста
ЛИТЕРАТУРА
Ангелачева, А. & Гергова, Е. (2003). Критериален тест „V-А група на Периодичната система и опазване на околната среда“. Научни трудове Пловдивски университет „Паисий Хиленадрски“, 40(2), 81 – 90.
Бижков, Г. (1996). Теория и методика на дидактическите тестове. София: Просвета.
Генкова, Л. & Найденова, В. (2003). Опитно-приложната и диагностично-изследователската дейност на учителя. София: Дъга – ВК.
Грабарь, М. & Краснянская, К. (1977). Применение математической статистики в педагогических исследованиях. Москва: Педагогика
Димитрова, В. (2006). Диагностика в университетското обучение по химия. Благоевград: Унив. изд. „Неофит Рилски“.
Иванов, И. (1999). Основи на педагогическата диагностика. София: Аксиос.
Клаус, Г. & Ебнер, Х. (1971). Основи на статистиката за психолози, педагози и социолози. София: Наука и изкуство.
Лакюрски, А. (1999). Математико-статистически методи в психолого-педагогическите изследвания. София: Софттрейд.
Наследов, А. (2012). Математические методы психологического исследования: анализ и интерпретация данных. Санкт-Петербург: Речь.
Стойчев, Д. (2007). Количествени методи за моделиране и диагностика в експерименталната педагогика, психология и социология. Пловдив: Унив. изд. „Паисий Хилендарски“.
Стоянова, Ф. (1996). Тестология за учители. София: Атика.
Аngelacheva, А. & Gergova, Е. (2013). Didactical tools for developing an environmental culture of pupils in chemistry in the secondary school. Chemistry, 22, 532 – 543 [In Bulgarian].