Образование за устойчиво развитие

ЗА СРЕДНИЯ АРИТМЕТИЧЕН УСПЕХ И ПРОБЛЕМИТЕ, СВЪРЗАНИ С НЕГОВАТА ЛОГИЧЕСКА СЪСТОЯТЕЛНОСТ

Маргарита Ламбова

Statistics and Applied Mathematics Department
University of Economics – Varna
77 Knyaz Boris I Blvd.
9002 Varna Bulgaria
E-mail: lambowa@yahoo.de

Резюме. Представени са разсъждения относно същността и логиката на индикатора среден успех, изчислен като средна аритметична величина. Засегнати са проблеми, свързани, от една страна, с процеса на измерване и формиране на успеха, а от друга – с предпоставките за приложение на средната аритметична от гледна точка на статистическата методология, поставящи под въпрос логическото съдържание на средния аритметичен успех, особено когато той се използва за сравнения.
В съответствие с поставената цел на изследването се предлага аргументация на тезата за логическата несъстоятелност на сравненията на успеваемостта с помощта на средна аритметична величина.

Ключови думи: average grade, measurement, statistical methodology, arithmetic mean, ordinal scale

Въведение

Въпреки че за измерване на степента на успеваемост на ученици и студенти в практиката масово и почти без резерви се използва средният успех, изчислен като средна аритметична величина, логическата състоятелност на тази конструкция може да бъде поставена под съмнение поради съществени проблеми, свързани, от една страна, с измерването на степента на усвояване на изискуемите знания и умения, т.е. с процеса на формиране на оценките, и от друга – с предпоставките за приложение на средната аритметична от гледна точка на статистическата методология.

Не може да бъде отречен познавателният характер на подобна величина, чрез която се дава обобщаваща оценка на усвоените от дадено лице знания, умения и способности и по този начин изпълнява редица полезни функции, като например диагностична, прогностична, мотивационна, стимулираща, санкционираща, всички допринасящи за поддържане и увеличаване на стремежа към натрупване на повече знания.

В практиката средният успех освен това се използва за сравнение и селекция на конкуриращи се индивиди, като поради редица съображения, свързани със същността ѝ, може да се твърди, че величината не е в състояние обективно да изпълнява тези функции. При сравнението надделява субективизмът, съпътстващ цялостния процес на формиране на успеха, поради което е невъзможно отчитането на размера на различието между успеваемостта на отделните конкуриращи се лица, за която могат да съществуват само степени, интервалите между които не са израз на количествената разлика в придобитите знания и умения.

Целта на изследването се състои в разкриване на проблемни моменти, свързани със същността на средния успех, и на тази основа аргументиране на тезата за логическата несъстоятелност на сравненията на успеваемостта с помощта на средна аритметична величина.

Проблемите, свързани с логическата състоятелност на средния успех, са от различно естество, като най-общо могат да бъдат отнесени в две основни групи, които в настоящата разработка ще бъдат разгледани диференцирано и са основание за формулиране на следните две основни задачи, чрез които да бъде постигната целта на изследването.

1. Разкриване на проблеми, свързани с измерването на усвоените знания и умения, т.е. с процеса на формиране на успеха, които поставят под въпрос логическата състоятелност на средния успех, особено когато той се използва за сравнения.

2. Разкриване на проблеми, свързани с неспазването на зададените от статистическата методология ограничения за приложение на средна аритметична величина при определянето на средния успех.

1. Проблеми на измерването на усвоените знания и умения

Обосновката на част от проблемите, свързани с измерването на степента на усвояване на изискуемите знания и умения, т.е. с процеса на формиране на успеха, може да бъде осъществена с помощта на теорията на измерването, която задава основните принципи и правила, регламентиращи начина на отреждане на числа на отделните наблюдавани обекти по такъв начин, че да се получи еднозначно (запазващо структурата) отражение на наблюдавани чрез числови съотношения.

Под измерване от гледна точка на математиката най-общо се разбира отреждането на числа на обекти или събития съобразно определени правила на проекцията (Stevens, 1959; Bühner & Ziegler, 2009).

Според Friedrichs (1973) измерването представлява систематичното отнасяне на дадено множество от числа или символи към значенията на дадена променлива, като се спазват принципите еднозначност (хомоморфност) и изключителност, което означава, че отнасянето трябва да се осъществява по такъв начин, че съотношенията между обектите да се запазят.

В основата на дефинициите за измерването стоят правилата на проекцията, които регламентират начина на отреждане на числа на отделните наблюдавани обекти, позволяващ еднозначно (хомоморфно) отражение на емпирични, т.е. наблюдавани, чрез числови съотношения.

Според Orth (1988) за измерване може да се говори само тогава, когато дадена числова релационна система е хомоморфна проекция на действително съществуваща емпирична релационна система.

Числова и емпирична релационна система са понятия, с помощта на коитоабстрактно се описва конструирането на скàли за измерване, т.е. на правила за измерване. Самият процес на конструиране на правила за измерване се нарича операционализация, като крайният продукт е определена измерителна скала. При емпиричните наблюдения се изхожда от това, че единиците притежават определени свойства независимо от процеса на наблюдение, т.е. разграничават се свойствата на единиците и резултатите от тяхното измерване, като това разграничение лежи в основата на емпиричната и числовата релационна система. Множеството от обекти на наблюдение и реално съществуващите между тях съотношения относно дадено свойство представляват емпирична релационна система, а за множеството от числа, чрез което се дефинират съотношенията между наблюдаваните обекти, се използва понятието числова релационна система. Взаимовръзката между емпирична и числова релационна система се задава чрез функция на отражението. Практическа стойност има само такава функция на отражението, която правдиво пресъздава структурата на множеството от обекти според наблюдаваното свойство, т.е. която позволява хомоморфна (съхраняваща структурата) проекция на действително съществуващата емпирична релационна система.

Дотук накратко бяха представени общите положения и основните понятия на теорията на измерването, които следва да бъдат конкретизирани от гледна точка на проблемите на измерването на усвоени знания и умения. Обекти на наблюдение в случая са оценяваните индивиди (ученици, студенти), а свойството, което подлежи на измерване, е степента на усвояване на изискуеми знания и умения по дадена учебна дисциплина. Това свойство по своята същност е качествен признак, неговите естествено подредени (степенувани) значения първично не могат да бъдат проектирани чрез числова система, тъй като не съществува и на този етап не може да бъде конструират измервателен уред, чрез който те да бъдат регистрирани. Освен това директното наблюдение на усвоените знания и умения не е възможно, признакът може да бъде отнесен към потенциално или косвено наблюдаемите (Bühner & Ziegler, 2009), като вместо усвоени за даден период се наблюдават показаните към даден момент знания и умения. Емпирична релационна система в случая представлява множеството от оценявани индивиди и реално съществуващите между тях съотношения относно степента на усвояване на изискуемите знания и умения по съответната учебна дисциплина. Измерването би трябвало да доведе до формирането на числова релационна система, която пресъздава правдиво реално съществуващите съотношения между степента на усвояване на изискуемите знания и умения на оценяваните индивиди, т.е. която представлява хомоморфна проекция. При косвено наблюдаеми свойства качеството на проекцията в голяма степен зависи от етапа на операционализация, който включва конструиране на индикатори, продукт на субективната преценка на наблюдаващия. Тези индикатори се основават на директно наблюдаеми признаци, за които се предполага, че са корелирани с изучаваното свойство, като чрез тях само косвено може да се проектира емпиричната в числова релационна система. Степента на съхраняване на структурата на изображението зависи основно от силата на връзката между включените в индикатора променливи и изучаваното свойство, както и от начина на измерване на директно наблюдаемите променливи.

От гледна точка на измерването на придобитите знания и умения се открояват следните особености.

1. Усвоените за даден период на обучение знания се измерват косвено чрез показаните към определен момент знания и умения, като се приема, че е налице много силна зависимост между двата признака.

2. Измерването на показаните знания и умения се осъществява чрез инструменти (контролни работи, тестове, реферати, курсови работи, изпити, практически задачи), които съдържателно са подчинени изцяло на субективния фактор.

3. Оценките, като индикатори на степента на усвояване на изискуемите знания и умения, се формират въз основа на субективни правила и критерии, които силно варират при различни системи на обучение и оценяване, преподаватели, учебни заведения, учебни дисциплини, във времето и т.н.

4. Използват се различни системи на оценяване, чийто продукт са числови проекции, които не представят по един и същ начин съотношенията между оценяваните индивиди по признака степен на усвояване на изискуеми знания и умения, като са възможни дори съществени противоречия.

Въз основа на изброените особености на измерването на степента на усвояване на изискуемите знания и умения ще се опитаме да отговорим на въпроса дали чрез изчисляване на среден аритметичен успех е възможно формирането на числова релационна система, която представлява хомоморфна проекция на емпиричната релационна система, т.е. дали може да се приеме, че съотношенията между средния успех на оценяваните индивиди съответстват на съотношенията между действително придобитите знания и умения по учебните дисциплини, изучавани през периода на оценяване.

За да се стигне до определяне на средния успех, първо трябва да бъде определен успехът по отделните изучавани дисциплини, което означава, че следва да бъдат формирани толкова числови релационни системи, колкото на брой са изучаваните дисциплини, като всяка трябва да представлява хомоморфна проекция на съответната емпирична релационна система, т.е. трябва да пресъздава правдиво съотношенията между усвоените знания и умения по съответната дисциплина в съвкупността на оценяваните индивиди. Това означава, че средният успех ще представлява хомоморфна проекция само тогава, когато по всички изучавани учебни дисциплини успехът също е такава проекция.

В съответствие с изброените особености на измерването на усвоените знания и умения възникват следните въпроси.

1. Може ли да се приеме, че съществува съответствие между действително усвоени за даден период и демонстрирани към дадени моменти знания и умения?

2. От какви други фактори освен от усвоените знания зависи представянето в момента на оценяване?

3. За какви съвкупности от оценявани индивиди може да се формира числова релационна система (съвкупност от оценки), която представлява хомоморфна проекция на действителните съотношения между усвоените знания и умения?

4. Възможно ли е сравнение на оценките, представляващи елементи на различни числови релационни системи, т.е. сравнение на оценки по дадена учебна дисциплина, получени при измервания, осъществени в рамките на различни условия (методи на обучение и преподаване, начини и критерии на оценяване, преподаватели, учебни заведения, периоди и т.н.)?

5. Възможно ли е противоречие между резултатите от измерването на усвоените знания и умения, получени въз основа на различни системи на оценяване?

Както вече беше посочено, косвено наблюдаемото свойство усвоени знания и умения се измерва чрез директно наблюдаемото свойство демонстрирани знания и умения, като се предполага, че съществува много силна зависимост между двете. Качеството на измерването, съответно на отражението, зависи изключително много от степента на съответствие между двете променливи. Тук на преден план излиза субективният фактор, от който зависи дали измерените знания се припокриват с действително усвоените, или има съществено разминаване между двете променливи. Безброй писани и неписани правила и критерии се използват с цел минимизиране на влиянието на субективния фактор и реално отчитане на действителната подготовка на оценяваните. Въпреки всичко той е основната смущаваща съответствието причина, като в зависимост от силата и начина на неговото въздействие съотношението между поставените оценки и реално съществуващото съотношение в знанията и уменията на оценяваните се разминават в по-малка или по-голяма степен. За съжаление, степента на несъответствие не подлежи на измерване и варира значително в зависимост от съдържанието на конструираните инструменти на измерване (контролни работи, тестове, задачи и т.н.), от психологическите нагласи и личностни качества на оценявани и оценяващи, от моментното емоционално състояние и физическо здраве на оценяваните, от начина на подготовка (непрекъснат и системен процес на обучение или механично запаметяване на учебния материал за кратко време, например дните между изпитите по време на сесия, водещо до кратковременни „знания“) и т.н.

След като начинът на измерване (оценяване) може да варира, като вариацията зависи от действието на различните фактори, хомоморфна проекция на реално съществуващи съотношения между степента на усвояване на изискуемите знания и умения на оценяваните индивиди чрез числова система на оценяване е възможна само при съобразяването с редица ограничителни условия, свързани с тези фактори. Колкото са повече тези условия, толкова по-малка ще бъде съвкупността от индивиди, за която е възможна хомоморфна проекция, т.е. за която съотношенията между поставените оценки съответстват на съотношенията между степента на усвояване на изискуемите знания и умения на отделните оценявани и оценките могат да бъдат използвани за сравнения между тях. Факторите, обуславящи оценяването, в случая могат да се разглеждат като идентификационни признаци, задаващи границите на съвкупността, която включва еднотипни по отношение на тези признаци единици. С други думи, запазваща структурата проекция чрез числова система на оценяване донякъде е възможна само за съвкупност от индивиди, които са поставени при идентични условия.

Възможно ли е при това положение да бъдат сравнявани например оценките, получени по дадена учебна дисциплина, на всички студенти, изучавали я в различни ВУЗ, по различно време, при различни преподаватели, учебни програми, методи на обучение, критерии на оценяване и т.н.? На практика е възможно, но това сравнение е лишено от логическо съдържание, то не е нищо друго освен сравнение на числа, които принадлежат на различни числови релационни системи, отразяващи по определен начин съотношенията в ограничени от горепосочените фактори съвкупности. След като тези числа принадлежат към различни проекции, съотношенията между тях не изразяват почти нищо, заради различните условия равностойни като числа оценки могат да бъдат с различно качествено съдържание, т.е. с различна съдържателна тежест.

Дотук разсъжденията бяха свързани основно с формирането и съпоставимостта на отделни оценки, получени при измерване на степента на успеваемост по конкретна учебна дисциплина, като се стигна до извода, че за съвкупности, поставени при идентични условия, са възможни смислени сравнения. Отнася ли се това и за средния успех, формиран от оценки, които са елементи на числови проекции на различни емпирични релационни системи? Ясно е, че както при сравняване на отделни оценки, така и при сравнение на средния успех, необходимо изискване за съпоставимост е сравняваните индивиди да са поставени при идентични условия, т.е. по всички учебни дисциплини да са обучавани и изпитвани от едни и същи преподаватели, обучението да е осъществявано по идентични учебни програми, учебници, да са използвани идентични методи и критерии на оценяване и т.н. Достатъчно ли е това, за да твърдим, че средният успех е логически състоятелен измерител на реалните съотношения между степента на подготвеност на индивидите, които са еднотипни според въведените ограничителни условия?

Няколко са съображенията, които подкрепят твърдението, че дори при сравнение на оценявани лица, поставени при идентични условия, средният успех не е ефикасен измерител на съотношенията между общата им подготвеност по учебните дисциплини, които участват във формирането му.

Степента на общата подготовка зависи не само от степента на усвояване на знанията по отделните дисциплини и не може да се разглежда като механичен сбор от изолирано натрупани знания и умения. Обобщаващата характеристика на подготовката по всички дисциплини би трябвало да дава възможност за отчитане на степента на осмисляне и обвързване на знанията и уменията, получени по отделните учебни дисциплини, т.е. тя би трябвало да оценява усвоените знания като система, а не като механичен сбор. Средният аритметичен успех не е в състояние да изпълнява подобна функция, при него под внимание може да се вземе единствено механичният сбор от изолирани системи от знания, като взаимовръзката между тях е без значение. Това означава, че средният успех не може да се приеме за еднозначна числова проекция на комплексната система от знания, която обуславя степента на общата подготовка. Не е изключено противоречие при сравнение на индивиди, от една страна, на базата на средния им успех и от друга – на базата на последващите им компетентности, въпреки че са оценявани при едни и същи условия по отделните учебни дисциплини. По-високият среден успех не означава автоматично по-добра способност за взаимно обвързване на усвоените знания и умения, т.е. по-ефикасна комплексна система от знания, оттам по-добра обща компетентност.

При формирането на средния успех оценките, получени по отделните дисциплини, обикновено участват с еднакво тегло, независимо каква е степента им на значимост при формиране на комплексната система от знания и умения. Въпреки че всички учебни дисциплини би трябвало да имат определен принос, може да се твърди, че те могат да бъдат степенувани по значимост при подготовката на определени компетентности (професия, специалност и т.н.). От гледна точка на общата логика, оценките по основополагащите дисциплини би следвало да бъдат с по-голямо тегло при установяване на обобщаваща оценка на степента на комплексната подготовка, но на практика се осъществява уравниловка, която лишава индикатора среден аритметичен успех от възможността да функционира като реално отражение на действително усвоените компетентности. Разсъжденията могат да бъдат онагледени с помощта на следния пример.

Иван и Петър са постигнали един и същ среден успех – много добър (5.00), след дадена сесия. Иван е наблегнал на изучаването на две дисциплини, които правилно е степенувал като особено значими за общата си подготовка по записаната от него специалност, и по тях е получил оценка „отличен“. Останалите две дисциплини е отчел като по-периферни, за тях не се е подготвил толкова задълбочено или не са му били интересни и е получил оценка „добър“. При Петър се е случило точно обратното – въпреки че той е осъзнал значимостта на първите две дисциплини, е имал значителни затруднения при усвояването на знанията и не е успял да се справи блестящо, получил е оценка „добър“. Другите две дисциплини са били по-лесни за подготовка, с по-занижени изисквания при проверката на знанията и заради стремежа си към висок среден успех Петър е положил максимални усилия да получи „отличен“. Ясно е, че еднаквият среден успех на Иван и Петър не отразява правдиво действително съществуващото съотношение между двамата според степента на обща компетентност по специалността.

Съществува още един проблем, който поставя под въпрос състоятелността на сравнения на базата на средния успех. Когато се приема, че дадена оценка съответства на определен относителен дял на показаните от изискуемите знания и умения, като този дял се движи в определен интервал, тогава е очевидно, че дори при абсолютно еднакви условия на оценяване тежестта на една и съща оценка може да се различава. Например при преминаване от система за точкуване от 0 до 100, която дава възможност за по-диференцирано оценяване, към система с малък брой балове, се налага въвеждането на скала за приравняване, при която на доста широки интервали съответства една и съща оценка. При изчисляване на средния успех обикновено се работи с оценките по балната система, като по този начин се пренебрегват различията в тежестта на равностойните оценки. В определени случаи това може да доведе до парадоксалното положение, при което оценяван с по-висок сумарен бал по точковата система да се окаже с по-нисък среден успех от други оценявани, които по всички учебни дисциплини са показвали знания и умения, съответстващи на долната граница на даден интервал, т.е. са изпълнили необходимия минимум за получаването на дадената оценка. Възможно е също така при един и същ среден успех по балната система да има значителна разлика между средния успех, получен след усредняване на постигнатите резултати по точковата система. Всичко това може да бъде онагледено с помощта на следния пример:

Въпреки че Мая е постигнала не само същия среден успех като Иво, но е получила и абсолютно равностойни на неговите оценки на всички положени изпити, е очевидно, че тя е показала по-висока степен на подготвеност, като по същество нейният среден успех не е равностоен на неговия. Николай е с по-нисък среден успех от Иво, но се оказва, че неговите оценки са с по-голяма тежест, тъй като за дадена оценка той е получавал повече точки и по този начин сумарният бал по точковата система се оказва по-висок, оттам – и средният брой получени точки.

Направените до този момент разсъждения позволяват твърдението, че от гледна точка на теорията на измерването при използване на средния аритметичен успех не е възможна достатъчно правдива проекция на действителните съотношения между степента на общата подготовка на оценяваните лица дори когато те принадлежат към една и съща съвкупност, хомогенна по отношение на начина на въздействие на субективния фактор, т.е. когато са поставени при идентични условия на преподаване и оценяване. След като не може да се приеме, че средният успех е в състояние да гарантира достатъчно висока степен на хомоморфност на проекцията, той няма как да изпълнява ефикасно наложилата се в практиката сравнителна функция.

2. Средният аритметичен успех – статистика или „стъкмистика“?

Както вече беше посочено, степента на усвояване на изискуемите знания и умения представлява качествена променлива, като измереният успех, т.е. поставената оценка, е индикатор, който се конструира на базата на косвени наблюдения, които са силно повлияни от действието на субективния фактор. Успеваемостта подлежи на степенуване, като интервалите между отделните степени не отчитат количествената разлика в придобитите знания и умения. Независимо от вида на използваната система на оценяване отделните значения на признака успех представляват степени, които се характеризират с естествена подреденост и това им свойство позволява въвеждането на числа (рангове), подходящи за представянето на тяхната възходяща или низходяща последователност. Привидно по този начин се осъществява трансформация на качествен в количествен признак, но метаморфозата е само външна. Качественият признак не се превръща в количествен само защото значенията му са получили числови наименования. Подобни признаци, въпреки числовите имена на отделните значения (степени), само по форма имитират количествените, по същност остават качествени. При тях не е логично количественото измерване на вариацията на значенията, тъй като „абсолютната разлика между значенията не може да бъде интерпретирана“ (Hartung, 2009).

По своята същност успехът е ординално скалиран признак, като първичните означения на отделните степени са словесни (слаб, среден, добър, много добър, отличен) и изразяват субективна преценка по отношение на успеваемостта, която изключва възможността за установяване на размера на различието между отделните значения, дори когато са им отредени поредни числови рангове (2, 3, 4, 5, 6), т.е. се премине към рангова скала като частен случай на ординалната. Във връзка с изчисляването на средния аритметичен успех възникват следните въпроси:

1. Къде е мястото на ординалната скала в йерархията на статистическите измерителни скали?

2. Кои средни величини са подходящи за определяне на център на разпределение при ординално скалиран признак?

3. Кои са необходимите изисквания за изчисляване на средна аритметична величина?

4. Възможна ли е трансформация на ординална в метрична скала?

5. Логически състоятелна ли е интерпретацията на абсолютната разлика между средния аритметичен успех на сравнявани лица?

В практиката обикновено не се обръща достатъчно внимание на статистическите измерителни скали, въпреки че скалирането на статистическите признаци е един от основните критерии при избор на подходящи измерители и методи за анализ. Недостатъчните или повърхностни знания по отношение на същността и йерархията на статистическите скали, както и по отношение на възможностите за трансформация на скалирането, са една от причините за прилагане на неподходящи или недопустими измерители и оттам – за логичес ката несъстоятелност на получените резултати. Извън полезрението остава логиката, свързана с йерархичната подредба на измерителните скали, т.е. с нивото на информация за различието между значенията на признака, което се достига при отделните скали, като най-ниското ниво се изразява в констатиране на различието (номинална скала), второто – в установяване на посоката на различието (ординална скала), третото – в измерване на абсолютния (интервална скала), и последното, най-високо ниво – в измерване на относителния (относителна скала) размер на различието.

За съжаление, това се отнася и до използването на средна аритметична величина като център на разпределение по ординално скалирания признак успеваемост. Преминаването от словесни означения на степените на успеваемост към рангове в практиката се приема като достатъчно основание за приложението на измерител, който е подходящ само при работа с количествени (интервално и относително скалирани) признаци. Ординалната скала е слаба скала, с ниско ниво на информацията относно различието между възможните значения на признака. Тя е по-силна само от номиналната скала, при която значенията са равнопоставени и може да се констатира единствено наличието или отсъствието на различие. Чрез ординалната скала освен това е възможно да се правят съждения относно посоката на различието, т.е. тя предоставя информация от типа: =, ≠, <, > (Lambova, Russev, Koseva & Stoyanova, 2012). Информация относно размера на различието не е възможна, което означава, че интервалите между ранговете, с които са означени отделните степени, не могат да се приемат като израз на количествената разлика между отделните значения. Поради тази причина са лишени от логическо съдържание конструкции, получени чрез операциите събиране, изваждане, умножение и деление на значенията на ординално скалиран признак. По-силна от ординалната е метричната (кардинална) скала, която отчита размера на различието между значенията на количествени признаци и от своя страна, в зависимост от възможностите за измерване на това различие, се подразделя на интервална и на относителна скала. Само метричната скала позволява измерване на различието (абсолютно и/или относително), следователно единствено при нея вариацията на значенията подлежи на интерпретация. Съществува възможност за трансформация на скалирането, но тя е еднопосочна – винаги от по-силна към по-слаба скала. От метрична скала може да се премине към ординална – например относително скалираният признак ръст в сантиметри може да се трансформира в ординално скалиран признак със значения нисък, среден, висок. Ординално скалираният признак успех обаче не може да бъде трансформиран в интервално или относително скалиран поради споменатата вече невъзможност за измерване на абсолютната и/или относителна разлика между отделните значения.

Средните величини, които могат да послужат като център на разпределение при дадено ниво на информацията, са съобразени с особеностите на съответната измерителна скала, т.е. с възможностите ѝ да регистрира различието между отделните значения на признака. При ординално скалиране е възможно възходящо или низходящо подреждане на значенията (степените). Това означава, че освен универсалната средна – модата, може да бъде определена и медианата – значението на централната единица при подреден възходящо или низходящо статистически ред на разпределение. Ако центърът на разпределението по признака успех бъде определен с помощта на модата, той ще съвпада с оценката, която е най-често срещана. Медианата ще бъде оценката, която при възходящо или низходящо подреждане на оценките по всички изучавани дисциплини се намира точно в центъра – половината от оценките са по-малки или равни на нея, съответно другата половина – по-големи или равни на нея. Тези две средни, за които предпоставките за приложение са налице при ординално скалиране, не се използват в българската практика за определяне на средния успех. Срещат се предложения за приложението на медианата като измерител на обобщената успеваемост по изучаваните дисциплини, като тази средна действително се използва в определени случаи (напр. при сравнението на средния успех на учениците от различни паралелки) в някои държави, но тя далеч не е толкова популярна, колкото средната аритметична. Предимство на медианата е, че нейната величина не се влияе от единични екстремни значения, които са в състояние да „теглят“ средната аритметична в едната или другата посока. Може да се твърди, че поради тази причина медианата е по-устойчив измерител на комплексната подготвеност на оценяваните.

За установяване на средния успех се използва масово средната аритметична, въпреки че приложението на средните алгебрични величини изисква количествена измеримост на усредняваните величини, за която естествената подреденост и възможността за ранжиране са необходимо, но не и достатъчно условие. Количественото измерване е свързано с отчитане на абсолютната разлика между величините. Следователно средните алгебрични, в частност средната аритметична, е допустимо да се използват за усредняване единствено на количествени, т.е. метрично скалирани признаци, което изрично се споменава в много от авторитетните чуждестранни учебници по статистика (Hartung, 2009; Bamberg, 2002; Voß, 2004, Fahrmeir, 2012, Bleymüller, 2008). Статистическата методология не само че не дава научна обосновка на утвърдилото се в практиката усредняване чрез средна аритметична на значенията на ординално, в частност рангово скалирани признаци, тя предоставя необорими аргументи за логическата несъстоятелност на подобна средна. След като значенията на ординално скалирани признаци не подлежат на сумиране заради невъзможността за установяване на размера на различието между отделните значения, какво представлява конструкция, получена с помощта на точно такава сума? Безсмислието е очевидно, но въпреки всичко практиката го налага, като по този начин прекроява статистиката и получава резултати, които биха могли да бъдат обозначени с наложилото се в разговорния език понятие „стъкмистика“. За съжаление, за разпространение на необоснованото използване на средната аритметична допринасят и редица български учебници и помагала по статистика, включващи примери, в които се търси средна аритметична от разпределения, формирани на базата на ординално, в частност рангово скалирани признаци – най-често под формата на среден успех.

Тук може да възникне въпросът защо да не е логично изчисляването на средна аритметична от равноотдалечени рангови оценки, ако се приеме, че еднаквите интервали между тях съответстват на приблизително равни разстояния между изискуемите знания и умения, които трябва да бъдат показани за получаването на съседни оценки? Най-вече в психологията и социалните науки при подобно ранжиране се правят опити за „околичествяване“ на ординално скалирани признаци и приемането им „на доверие“ за метрично скалирани. В психологията е въведен терминът „измерване per fiat“ (Wenninger, 2000; Schnell, Hill & Esser, 2013; Bühner & Ziegler, 2009) за случаите, в които се игнорира действителното ординално скалиране на променливите и с тях се работи „на доверие“ като с метрично скалирани, като по този начин се заобикалят изискванията за приложение на параметрични статистически методи. Това „либерално“ отношение на ползвателите на статистически методи влиза в противоречие с изискванията на статистическата методология, но въпреки всичко се налага масово в практиката, като в повечето случаи не се търси отговор на въпроса доколко логически състоятелни са резултатите от подобен анализ.

В параграф първи разсъжденията бяха свързани с измерването на успеваемостта и се стигна до заключението, че това измерване е подчинено изцяло на субективния фактор и числовата проекция под формата на съвкупност от оценки не може да бъде напълно еднозначна проекция на действително съществуващите съотношения между усвоените знания и умения на съвкупността на оценяваните лица. Следователно едва ли е възможно да се предположи и приеме, че еднаквото разстояние между оценки (рангове) съответства на еднаква разлика в натрупаните знания.

Отговор на въпроса може да бъде даден и с помощта на особеностите на ординалната скала. За всяка измерителна скала са допустими определени трансформации на значенията, които не водят до промяна напървоначалните съотношения. Според Schnell, Hill и Esser (2013) приложението на даден статистически метод е допустимо само тогава, когато достоверността (истинността) на резултатите от приложението му не се променя при всички позволени за съответната скала трансформации на значенията на признака. При ординално скалиране на променливите са допустими трансформации, запазващи естествената подреденост на значенията (Sachs, 2004). Това са всякакви строго монотонни трансформации, при които новото значение x∗ се получава от първоначалното x чрез x∗ = f (x ) по такъв начин, че за две произволни значения x1 < x2 след трансформацията ∗ ∗ е валидно x1 < x2 (Bleymüller, Gehlert & Gülicher, 2008). Към строго монотонните трасформации, допустими при ординално скалиране на променливите, се отнася и степенуването на положителни числа (Sachs, 2004). Следователно, ако средната аритметична въпреки направените до този момент разсъждения все пак е допустимо да се използва за усредняване на значенията на признака успех, не би трябвало да се получат противоречиви резултати, когато тя бъде изчислена паралелно от изходните оценки по балната система, от точковите оценки по точкова система и от повдигнатите на квадрат оценки по балната система1), тъй като става въпрос за строго монотонна трансформация на изходните значения. Въз основа на следния пример може да бъде доказано, че трансформациите водят до промяна на първоначалните съотношения:

В случай че средният аритметичен успех е логически състоятелен измерител на централната тенденция, съотношението между Мария и Иван би се запазило при всички допустими при ординално скалиране трансформации на оценките, включително при посочените в дадения пример. С други думи, ако се изхожда от оценките по балната система и тяхната средна, Мария би трябвало да бъде с по-висок среден успех от този на Иван независимо от използваната система на оценяване. Както се вижда, налице е противоречие – средните, получени от трансформираните оценки, са по-малки, отколкото тези на Иван, което означава, че не е гарантирана непроменяща се достоверност на резултатите от приложението на средната аритметична при допустимите за ординалната скàла трансформации на значенията. Освен това при сравнението на средния успех по балната система, съответно добър (4.4) и добър (4.2), абсолютната разлика, възлизаща на 0.2 пункта, е лишена от логика, тъй като тя не може да бъде интерпретирана като 0.2 пункта по-добра обща подготовка на Мария в сравнение с Иван.

Направените разсъждения позволяват твърдението, че от гледна точка на изискванията на статистическата методология средната аритметична не е допустим измерител на центъра на разпределение по признака успех. Абсолютната разлика между средния успех на сравнявани лица не е в състояние да измери различието в степента на общата им подготовка, тъй като поради ординалното скалиране не подлежи на интерпретация. Средният успех, изчислен като средна аритметична, може да характеризира донякъде степента на обща подготовка по изучаваните дисциплини само когато е цяло число и съвпада с едно от значенията (степените) на признака, всяка друга междинна величина би следвало да се възприема като абстрактна конструкция, тъй като не може да бъде установено какво точно изразява абсолютната разлика между нея и възможните оценки по балната система.

Като подходяща и допустима от гледна точка на статистическата методология алтернатива на средната аритметична при определяне на център на разпределение по признака успех се откроява медианата, която съвпада с дадена степен (оценка) по балната система и не налага сравнение на базата на безсмислени различия, възлизащи на част от разстоянието между две съседни оценки.

Заключение

В съответствие с поставената цел направените разсъждения са свързани с проблемни моменти, поставящи под въпрос логическата състоятелност на средния успех, изчислен като средна аритметична, особено когато последният изпълнява сравнителна функция.

Изследването включва две основни направления, като диференцирано са разгледани две групи проблеми.

1. Проблеми, свързани с измерването на усвоените знания и умения, т.е. с процеса на формиране на успеха.

2. Проблеми, свързани със скалирането на успеха и с изискванията на статистическата методология по отнощение на приложението на средна аритметична величина като център на разпределението.

Разсъжденията и аргументите, свързани с първото направление, позволяват следните основни изводи.

– От гледна точка на теорията на измерването, средният аритметичен успех не може да гарантира достатъчно правдива проекция на действителните съотношения между степента на общата подготовка на оценяваните лица, дори когато са поставени при идентични условия на преподаване и оценяване.

– След като е възможно да се приеме, че средният аритметичен успех по-ради високата степен на субективизъм при формирането си не е в състояние да осигури достатъчно високо качество на отражението на действителната обща подготовка на оценяваните лица, той няма как да изпълнява ефикасно наложилата се в практиката сравнителна функция.

Въз основа на разсъжденията и аргументите, свързани с второто направление на изследването, могат да бъдат направени следните обобщаващи изводи.

– От гледна точка на изискванията на статистическата методология, средната аритметична не е допустим измерител на центъра на разпределение по ординално скалирания признак успех.

– Абсолютната разлика между средния успех на сравнявани лица не е в състояние да измери различието в степента на общата им подготовка, тъй като поради ординалното скалиране не подлежи на интерпретация.

– Центърът на разпределение по признака успех вместо чрез средна аритметична величина може да бъде определен с помощта на допустимата при ординално скалиране медиана, която съвпада с дадена степен (оценка) по балната система, устойчива е по отношение на единични екстремни оценки и не налага сравнение на базата на лишени от логическо съдържание различия, възлизащи на част от интервала между две съседни оценки.

NOTES/БЕЛЕЖКИ

1. Примерът с повдигнатите на квардат оценки е заимстван от Schnell, Hill & Esser (2013).

REFERENCES/ЛИТЕРАТУРА

Ламбова, М., Русев, Ч., Косева, Д. & Стоянова, В. (2012). Въведение в статистиката. Варна: ИК СТЕНО [Lambova, M., Rusev, Ch., Koseva, D. & Stoyanova, V. (2012). Vavedenie v statistikata. Varna: IK STENO].

Bamberg, G. & Baur, Fr. (2002). Statistik. München, Wien, Oldenbourg Verlag.

Bleymüller, J., Gehlert, G. & Gülicher, H.(2008) Statistik für Wirtschaftswissenschaftler. München, Verlag Franz Vahlen.

Bühner, M. & Ziegler, M.(2009). Statistik für Psychologen und Sozialwissenschaftler. München, Pearson Verlag.

Fahrmeir, L., Künstler, R., Pigeot, Ir. & Tutz, G.(2012). Statistik. Berlin, Heidelberg, New York, Springer Verlag.

Friedrichs, J. (1973). Methoden empirischer Sozialforschung. Hamburg, Verlag Rowohlt.

Hartung, J. (2009). Statistik. Lehr- und Handbuch der angewandten Statistik. München, Oldenbourg Verlag.

Lambova, M., Russev, Ch., Koseva, D. & Stoyanova, V. (2012). Introduction to the statistics. Varna, publishing house STENO[Ламбова, М., Русев, Ч., Косева, Д. & Стоянова, В. (2012). Въведение в статистиката. Варна,ИК „СТЕНО“].

Orth, B. (1988). Messtheoretische Grundlagen der Diagnostik. In: R. J. Jäger (Hrsg.). Psychologische Diagnostik. München, Psychologie Verlags Union.

Sachs, L. (2004). Angewandte Statistik. Anwendung statistischer Methoden. Berlin, Heidelberg, New York, Springer Verlag.

Schnell, R., Hill, P. B. & Esser, E. (2013). Methoden der empirischen Sozialforschung. München, Oldenbourg Verlag.

Stevens, S.S. (1959). Measurement, psychophysics, and utility (pp. 18 – 63). In: C.W. Churchman and P. Ratoosh (Eds.). Measurement. Definitions and theories. New York, John Wiley.

Voß, W. (2004). Taschenbuch der Statistik. Leipzig, Fachbuchverlag.

Wenninger, G. (2000). Lexikon der Psychologie. Heidelberg, Spektrum Akademischer Verlag.

Година XXV, 2017/2 Архив

стр. 159 - 174 Изтегли PDF