Въпроси на преподаването
ИЗУЧАВАНЕТО НА МЕРНИ ЕДИНИЦИ ЗА БИНАРНА ИНФОРМАЦИЯ – УЧУДВАЩО УПОРСТВАЩ ПРОБЛЕМ ЗА БЪЛГАРСКАТА ОБРАЗОВАТЕЛНА СИСТЕМА
https://doi.org/10.53656/math2022-5-4-izu
Резюме. В исторически план, информатиката използва десетилетия наред езиково погрешни мерни единици за определяне на обеми от бинарни (двоични) данни. Масово, по цял свят, се използваха представките кило-, мега-, гига- и т.н. за числа степени на 10, докато реалните мерни единици са степени на 2. Процесът по въвеждане на новите представки на мерните единици за бинарни данни киби-, меби-, гиби- и т.н. започна през 1999 г. Това нововъведение се оказа трудно за налагане в практиката, защото старите представки вече бяха добили прекалена масовост в обществото и новите не се наложиха в ежедневните разговори. Повечето производители на хардуер и софтуер отказват да използват новите мерни единици, вероятно защото не е изгодно за тях от маркетингова гледна точка. Не само това, но някои производители отказаха да започнат да измерват правилно с новите стойности за старите мерни единици. Този проблем се пренесе и в образователната система, където нововъведението се сблъска със силна консервативност и дори откровено нежелание на учители да преподават новите мерни единици. В статията се разглежда проблемът от педагогическа гледна точка и се предлагат някои насоки за ефективното преподаване на новите префикси при спазване на учебната програма по информационни технологии за VI клас.
Ключови думи: информатика; данни; мерни единици; килобайт; кибибайт; мегабайт; мебибайт; терабайт; тебибайт
1. Езиковедският проблем при мерните единици за информация
Международната система за мерни единици SI (Burdun 1960) е приета за първи път през 1960 г. и е най-масово използваната в света. Тя е резултат от дългогодишен труд на световната научна общност, който започва още в края на XVIII век, но става официална с Конвенцията за метъра през 1875 г. (Débarbat & Quinn 2019) и преминава през създаването на Системата метър – килограм – секунда (MKS) от 1889 г. (Williams 2014) със свои последващи ревизии за добавяне на още физични величини. Покъсноч, през 1971 г., към системата SI се добавя мерната единица за количество вещество мол (Gorin 2003), с което в нея основните величини стават седем на брой и остават такива и до днес – метър, килограм, секунда, ампер, келвин, мол и кандела.
Таблица 1. Представки и техните означения, използвани за означаване на някои десетични кратни и дробни
Метричната система е традиционна за Република България, а съвременните международни стандарти са практически въведени чрез Закона за измерванията1) и свързаната с него Наредба за единиците за измерване4) , разрешени за използване в Република България (2002). В Наредбата са представени кирилизирани представки и означения за десетични кратни и дробни, които са съответни на системата SI (табл. 1) и са обект на настоящата статия.
Масовите компютри са базирани на двоична бройна система и съответно най-малката единица за обем данни при тях е „бит“ (2 0, т.е. две възможни стойности – 0 или 1). За удобство в практиката като основна единица за обем на данни се използва въведената в (Brooks et. al 1959) мярка „байт“ (byte). Един байт съдържа 2 3, т.е. 8 бита. Тя се приема за основна и впоследствие се налага масово поради факта, че дълго време най-често са се употребявали кодови таблици, при които един клавиатурен знак заема точно 8 бита. Думата „байт“ остава основна мерна единица за обема на данни и по традиция се използва до днес.
Метричната система SI никога не е била предназначена за измерване на обеми от данни при компютрите, но въпреки това десетилетия наред информатиците използваха погрешно именно част от нейните десетични представки за измерване на такива обеми. Исторически погрешно се наложиха мерките „килобайт“ за 210, или 1024 байта, „мегабайт“ за 2 20, или 1 048 576 байта, което е 1024 килобайта, и т.н. Когато компютрите навлязоха масово в обществото, това беше еднозначно оценено като езиковедски проблем, защото потребителите, които не са специалисти, работят в ежедневието си само с десетична бройна система и съответно измерването в двоична за тях е неестествено. Масово започна да се допуска грешката, че например 1 килобайт е „1000 байта“. С нарастването на обемите от информация тази грешка започна да се увеличава значително. Ако разликата между 1000 и 1024 байта за един килобайт e 2,4%, то между 1e+12 и реалното закръглено 1.1e+12 байта за един терабайт тя вече е 10% (без закръгляването 9,95%).
Проблемът всъщност се задълбочи още повече заради напълно неконсистентното поведение на производители на хардуер и софтуер. Докато например в операционните системи се използваха по-скоро бинарните (двоични) стойности, производителите на твърди дискове и на мрежово оборудване масово употребяваха десетичните им еквиваленти. Появиха се дори нелогични хибридни варианти, като например 3,5-инчовите дискети, които бяха етикетирани като съдържащи обем от 1,44 MB, но реално можеха да съхранят точно 1,44×1000×1024 байта (Null & Lobur 2014, 6), т.е. нито метричното, нито бинарното значение на тогавашната дума „мегабайт“.
Добре е да се отбележи и още един важен недостатък. През годините, и до днес, продължава некоректното съкратено изписване на мярката килобайт. Тя трябва да се изписва kB, т.е. с малка буква k, а не с главна. Това е така, защото според системата SI главната буква K се използва за мерната единица „келвин“ и едно означение KB би трябвало да се приема буквално като „келвинбайта“, което е абсурдно.
Научната общност отдавна е забелязала този проблем. Например в (Morrison 1968) се предлага за килобайт вместо kB да се използва κB (с гръцката буква капа), за да не се получава въпросното объркване. Това може да е било възможно да се приеме като стандарт при научни статии, но е било непрактично при набиране на текст на тогавашен компютър, поради което тази и други подобни идеи са били отхвърлени. С масовото навлизане на компютрите в ежедневието проблемът се задълбочава и по-ради тази причина към началото на 90-те години на миналия век назрява нуждата международни организации да се заемат с разрешаването му.
През 1996 г. Международната електротехническа комисия предлага т.нар. „бинарни префикси“ киби- (Ki), меби- (Mi), гиби- (Gi) и теби- (Ti), като съкращения на „КИлоБИнарен“, „МЕгаБИнарен“, „ГИгаБИнарен“ и съответно „ТЕраБИнарен“ обем данни. Впоследствие към предложението се добавят и по-високите стойности пеби(Pi) и ексби(Ei). В крайна сметка, се достига до стандарта IEC 60027-2, който е публикуван през 1999 г. (Thor 2000). При редакция от 2005 г. са добавени зеби- (Zi) и йоби- (Yi). Това предложение се посреща с одобрение от научната общност. В крайна сметка, се достига до хармонизирания стандарт ISO/IEC 80000-13:2008, с който вече дори се заговори за зараждане на термини като „софтуерна метрология“ (Flater 2021). Оттогава до днес основните префикси за измерване на обеми от информация при компютрите се използват както е показано в табл. 2.
Таблица 2. Основни единици за количество байтове с десетични и с двоични представки
2. Въвеждането на двоичните представки за бинарна информация в българските учебни програми за началното и основното образование
Новите стандарти за мерни единици за данни бяха въведени в учебните програми на МОН и се изучават на два основни етапа. В актуалните програми за първи път десетичните представки се преподават в IV клас при предмета компютърно моделиране2), а двоичните се въвеждат при предмета компютърно моделиране и информационни технологии в VI клас 3).
Като цяло, всички одобрени от МОН съвременни български учебници отразяват коректно заложеното в учебните програми. Ежегодно се провеждат редица квалификационни курсове за учители, т.е. би трябвало да се приеме, че учителите отдавна са информирани и са достатъчно подготвени да ги предадат на своите ученици. Въпреки това изключително често в учителски групи от социалните мрежи може да се наблюдават едни и същи дискусии по темата, които често прерастват в агресивни спорове и достигат дори до употреба на обидни квалификации между участниците. Впечатлението от тях е, че разумните защитници на тезата, че и двете различни мерни единици трябва да се изучават, са или малцинство, или предпочитат да не участват в спора. Мнението на автора е, че най-често срещаните крайни позиции на коментиращите могат да бъдат обобщени в следните групи.
– Учители, които смятат, че не съществува исторически проблем и новите двоични представки са напълно ненужни. Често изказват тезата, че когато самите те са били ученици или студенти, са се използвали само десетичните представки и според тях всичко си е било наред, т.е. няма проблем да се продължи по традиция да се преподава по същия начин. Част от тези педагози твърдят, че категорично не приемат двоичните представки, и продължават да учат своите ученици по погрешния начин. Напълно отхвърлят тезата, че например „кило-“ идва от системата SI и е еквивалент на „хиляда“ и изказват мнение, че щом компютрите използват двоична бройна система, едва ли не трябва автоматично да се подразбира, че всички мерни единици, които ползваме в информатиката, трябва да са степени на двойката, т.е. „кило-“ за тях е 1024. Очевидно става дума за крайно консервативни учители, които не желаят да излязат извън своята зона на личен комфорт и да приемат нови знания. Това обикновено (но не задължително) са по-възрастни педагози, които имат дългогодишен опит и са натрупали голямо самочувствие. Те по правило се отнасят най-агресивно в споровете и дори си позволяват да използват по-крайни думи и епитети към останалите, които не са съгласни с тях.
– Учители, които приемат, че езиковедският проблем наистина съществува, но смятат, че изучаването на двоичните представки в училище е ненужно, защото е много трудно и само обърква учениците. Логична хипотеза е, че това най-вероятно са учители, които реално са изпитали затруднение при преподаването на този учебен материал, и е вярно, че техните ученици не са успели да го научат качествено. Естествената хипотезата е, че това са, като цяло, неопитни учители, които не успяват да преподават качествено, поне в тези конкретни уроци. При тях не се наблюдава отчетлива зависимост с възрастта – има както новопостъпили млади педагози, така и хора с дългогодишен стаж. Обикновено такива учители се изказват значително по-сдържано от останалите и най-често приемат с одобрение всякакви методически съвети за това как този учебен материал може да се преподава по такъв начин, че на учениците да им бъде по-интересно.
– Учители, които изразяват недоволство от това, че представките се учат на два етапа в различни класове, и реално не разбират същината на проблема. Често от тях се изказва мнение, което може да се обобщи като „веднъж учим децата погрешно, а после трябва да се поправяме“. Твърдението, че е имало неправилно обучение, веднага активира хипотеза, че тези учители всъщност не разбират проблема с мерните единици в достатъчна дълбочина.
По третата точка наистина би могло да се помисли за известна промяна в учебните програми, но трябва да се има предвид, че изложените от споменатите учители доводи не са верни. Първо, не е вярно, че в IV клас по компютърно моделиране децата научават мерните единици погрешно. Напротив, съвсем коректно е заложено да изучават десетичните представки, и съвсем правилно се показват техните стойности като степени на десетката. Проблемът тук вероятно се корени изцяло в операционната система Windows, която е и най-масово използвана в компютърните зали на българските училища. Действително, от Microsoft и до ден-днешен упорито отказват да въведат новите означения в своя софтуерен продукт, и продължават да използват не само погрешните означения MB за мебибайт, TB за тебибайт и т.н., но дори и напълно погрешното изписване KB за кибибайт. Второ, това разделяне на учебния материал в две части и стъпаловидното му надграждане (Ganchev & Grozdev 2009), по принцип, е нещо съвсем нормално, защото в случая по-малките ученици все още изпитват затруднения при аритметични операции с големи числа. Очевидно изключение при такива пресмятания е, когато се използва число, което е степен на 10, т.е. не би било математическо предизвикателство и няма да отклони съществено вниманието от основната тема. Затова е допустимо при по-малките ученици да се въвеждат пресмятания с големи числа, когато те са „кръгли“ (завършват с много нули). Обратно – учениците от VI клас са по-подготвени и е нормално да могат да бъдат натоварени с по-трудна аритметика.
В рускоезичната научна литература на поне две места се повдига и още една тема за размисъл, която може би си заслужава да бъде разгледана и от български езиковеди. Колеги от Беларус (Kundas et al. 2007) смятат, че двоичните представки са неблагозвучни за техния език. В (Pobedenskij 2014) не само се подкрепя това мнение, но и се предлага в Русия новите представки да се произнасят по различен начин: кибайт вместо кибибайт, мибайт вместо мебибайт, и т.н., т.е. да се премахне „би“-то. Това е отворен въпрос, защото немалка част от коментарите в споменатите дискусии от социалните мрежи включват именно вулгарна езикова закачка точно с тази част от новите мерни единици – „иби“ и „еби“, което несъмнено може да се пренесе и при учениците.
3. Методи за сно даване на двоичните
Един от основните проблеми при преподаването на урока за единици за обем на данни в VI клас е, че по същество става дума за математика и учебните задачи често се свеждат само до поредица от пресмятания – да се превърнат едни мерни единици в други, да се провери дали определен набор от файлове ще се побере на конкретен носител на данни, и други подобни. Това е нетипично за изключително практически насочен предмет, какъвто е информационни технологии. Първата очевидна причина учениците да усвояват по-трудно този материал, е, че наистина в ежедневието десетичните представки се използват много масово навсякъде и вероятно двоичните представки им се струват изкуствени и ненужни. Втората е, че те очакват от този учебен предмет значително повече интерактивно взаимодействие с компютъра, а не математически пресмятания.
Урокът може да стане значително по-практически насочен, като се приложи софизъм, с който учениците да бъдат предварително поставени в изключително практична проблемна ситуация. Използвайки факта, че носителите на данни, като флаш памети и твърди дискове, използват десетични представки на етикетите си, а Microsoft Windows ги визуализира погрешно с десетични представки за техните двоични обеми, учителят може много лесно да започне своя урок, като покаже например една USB флаш памет, на опаковката на която ясно е изписан обем в GB, и после да покаже как в Windows Explorer се визуализира съвсем различен обем. Такъв пример е показан на фиг. 1. В реда с общия обем на паметта излиза погрешно, че обемът е 1,86 GB (всъщност 1,86 GiB), докато на физическия носител пише 2 GB.
Въпросът към учениците „Защо има разлика?“ идва по естествен път. Нататък следва историческият разказ как се е стигнало до тази ситуация, с който учителят въвежда новите мерни единици. Така новите знания се поднасят при настъпила нужда да бъдат научени, а не догматично. Допълнителна информация за учениците може да е, че например при операционните системи на Apple и при мобилните телефони с Android се използват коректно десетичните представки, в Linux/BSD системите могат да се използват както двоичните, така и десетичните представки, а само в Windows изписването на мерните единици е погрешно. Това обикновено е не само практически полезно за тях, защото разширява кръгозора им, но и се приема с повишен интерес.
Друга полезна чисто практическа демонстрация може да бъде направена с оптичен диск. Стандартът за Compact Disc (CD) е създаден много преди новите мерни единици да влязат в сила и поради тази причина на кутиите на празните записваеми дискове обикновено пише 700 MB, но реалният им капацитет е 700 MiB. Същото нещо важи и до ден-днешен за оперативните (RAM) памети – те се етикетират с десетична мярка GB, но реалният им обем е като за същото число в GiB. Като контрапример при DVD е спазено изписване с десетична мярка 4,7 GB, което е и реалният им обем. BlueRay дисковете също използват десетични мерки и ги спазват коректно. Хубаво е да се спомене и мрежовото оборудване – там традиционно винаги са се използвали десетичните префикси (килобити в секунда, мегабити в секунда и т.н.). Бързината на процесорите също може да се даде като препратка за това, че десетичните представки се използват и за други мерни единици при компютрите – мегахерци и гигахерци, а не само за обеми от данни.
Всички тези примери са интересни за учениците, защото се илюстрират с обекти, които те познават от реалния свят. При възможност е препоръчително да се демонстрира нагледно споменатият по-горе пример за 3,5-инчовите дискети (освен ако компютърът на учителя не е много стар, най-вероятно няма да има вътрешно флопидисково устройство, но такива се продават сравнително евтино като външни устройства, които се включват към компютъра през USB). Това е не само хубав практически пример за това как мерните единици са важни и съответно стандартизациите при означенията не са безполезни, но също така е атрактивна демонстрация на стара компютърна техника. Днешните ученици не са виждали дискети, но обикновено знаят за тяхното съществуване и се радват да видят „иконката за запаметяване“ на живо. И още, това би разнообразило и обогатило възможния набор от учебни задачи с по-практическа насоченост, като например „колко дискети се побират на един CD и колко – на един DVD?“. Класическата задача да се превърне някакъв обем с десетична представка в такъв с двоична (или обратно), би могла да бъде зададена като „колко гибибайта закръглено до цяло число би показал Windows за твърд диск, на който пише, че е с размер 500 GB“ или въпрос уловка „колко GB в Windows ще покаже твърд диск, който е с обем 465 GiB“. С подобни задачи се изостря вниманието на учениците към детайлите от реалния свят и по този начин те чувстват знанията значително по-полезни за самите себе си.
4. Заключение
Дискусиите в социалните мрежи показват еднозначно, че е необходимо учителите да получават значително повече и по-адекватна помощ за опресняването на знанията им, особено когато се касае за въвеждане на нов учебен материал. Учебниците поднасят коректно информацията за тях и техните ученици, но може би трябва да се поработи по-сериозно в посока на извършване на повече и по-мащабни апробации, на базата на които да се изготвят по-добри методически материали за учителите и да се провеждат по-целенасочени квалификационни курсове. Тези апробации трябва да предшестват нововъведенията в учебните програми, за да може подобни на дискутирания проблем да не бъдат преборвани „на терен“. В противен случай не е малък рискът учителите да саботират иначе позитивните намерения за осъвременяване на учебното съдържание.
БЕЛЕЖКИ
1. Закон за измерванията (2002). Обн. ДВ. бр.46 от 7 май 2002 г., изм. ДВ. бр.88 от 4 ноември 2005 г., изм. ДВ. бр.95 от 29 ноември 2005 г., изм. ДВ. бр.99 от 9 декември 2005 г., изм. ДВ. бр.36 от 4 април 2008 г., изм. ДВ. бр.82 от 16 октомври 2009 г., изм. ДВ. бр.39 от 20 май 2011 г., изм. ДВ. бр.38 от 18 май 2012 г., изм. ДВ. бр.77 от 9 октомври 2012 г., изм. ДВ. бр.15 от 15 февруари 2013 г., изм. ДВ. бр.66 от 26 юли 2013 г., изм. ДВ. бр.98 от 28 ноември 2014 г., изм. ДВ. бр.14 от 20 февруари 2015 г., изм. ДВ. бр.58 от 18 юли 2017 г., изм. ДВ. бр.12 от 6 февруари 2018 г., изм. и доп. ДВ. бр.72 от 13 септември 2019 г.
2. МОН (2019). Учебна програма по компютърно моделиране за IV клас (общообразователна подготовка).
3. МОН (2020). Учебна програма по компютърно моделиране и информационни технологии за VI клас (общообразователна подготовка).
4. Наредба за единиците за измерване, разрешени за използване в Република България (2002). Приета с ПМС № 275 от 29.11.2002 г. Обн. ДВ. бр.115 от 10 декември 2002 г., изм. ДВ. бр.40 от 16 май 2006 г., изм. ДВ. бр.8 от 29 януари 2010 г., изм. и доп. ДВ. бр.46 от 19 май 2020 г.
ЛИТЕРАТУРА
КУНДАС, С. П., ТОНКОНОГОВ, Б. А., & ГИШКЕЛЮК, И. А., 2007. Курс лекций по дисциплине „Информатика и программирование (информационные технологии)“ для студентов специальности „Информационные системы и технологии (в экологии)“.
ПОБЕДИНСКИЙ, Г. Г., 2014. Создание и обновление геопространственных данных Российской Федерации (продолжение). Геодезия и картография, 2, 2 – 10.
REFERENCES
BROOKS, F. P., BLAAUW, G. A., & BUCHHOLZ, W., 1959. Processing data in bits and pieces. IRE Transactions on Electronic Computers, 2, 118 – 124.
BURDUN, G. D., 1960. International system of units. Measurement Techniques, 3(11), 913 – 919.
DÉBARBAT, S., & QUINN, T., 2019. Les origines du système métrique en France et la Convention du mètre de 1875, qui a ouvert la voie au Système international d‘unités et à sa révision de 2018. Comptes Rendus Physique, 20(1 – 2), 6 – 21.
FLATER, D., 2021. A system of quantities from software metrology. Measurement, 168, 108435.
GANTCHEV I., GROZDEV S., 2009. “On Two Fundamental Approaches to the Development of Scientific Knowledge and Their Implementation in Didactics of Mathematics”, Proceedings of the 6th Mediterranean Conference on Mathematics Education, Plovdiv, 2009.
GORIN, G., 2003. Mole, mole per liter, and molar: A primer on SI and related units for chemistry students. Journal of Chemical Education, 80(1), 103.
KUNDAS, S. P., TONKONOGOV, B. A., & GISHKELJUK, I. A., 2007. Kurs lekcij po discipline „Informatika i programmirovanie (informacionnye tehnologii)“ dlja studentov special‘nosti „Informacionnye sistemy i tehnologii (v jekologii)“/SP Kundas, BA Tonkonogov, IA Gishkeljuk.
MORRISON, D. R., 1968. Letters to the editor: Abbreviations for computer and memory sizes. Communications of the ACM, 11(3), 150.
NULL, L., & LOBUR, J. (2014). Essentials of Computer Organization and Architecture. Jones & Bartlett Publishers.
POBEDINSKIJ, G. G., 2014. Sozdanie i obnovlenie geoprostranstvennyh dannyh Rossijskoj Federacii (prodolzhenie). Geodezija i kartografija, 2, 2 – 10.
THOR, A. J., 2000. Prefixes for binary multiples. Metrologia, 37(1), 81.
WILLIAMS, J. H., 2014. A True Universal Language? In Defining and Measuring Nature: The make of all things. Morgan & Claypool Publishers.