Изследователски проникновения
ГЕНЕРАТИВЕН ИЗКУСТВЕН ИНТЕЛЕКТ В ОБРАЗОВАНИЕТО: ПРОБЛЕМИ И РЕШЕНИЯ
https://doi.org/10.53656/ped2025-9.04
Резюме. През последните години инструментите с генеративен изкуствен интелект (ИИ) променят начина, по който се търси информация, и се очертават като мощно средство за генериране на съдържание и изпълнение на интелектуални задачи. Тази статия представя възможности за приложение на генеративни ИИ инструменти в образованието, изследва потенциални проблеми при тяхното използване и представя решения за тяхното преодоляване. Основно място е отделено на необходимостта от разработване на политики и стратегии за ефективно използване на ИИ във ВУЗ като фактор за насърчаване на иновации в обучението, както и от методики и инструменти за автоматизирано оценяване на качеството на генерираното с ИИ учебно съдържание.
Ключови думи: образование; автоматизирано оценяване на качеството; генеративен изкуствен интелект; качество на генерирано учебно съдържание
1. Въведение
Дигиталната трансформация във всички области води до промяна в начина на организиране на учебния процес и необходимост от подготовка на студентите за работа в непрекъснато развиващия се технологичен свят. За да поддържат висока мотивацията на студентите, преподавателите търсят начини да интегрират нововъзникващи технологии в учебния процес и прилагат иновативни стратегии за преподаване. През последните години инструментите с генеративен изкуствен интелект (ИИ) променят начина, по който се търси информация, и се очертават като мощно средство за генериране на съдържание и изпълнение на интелектуални задачи. Тази трансформация поставя съществени предизвикателства пред традиционните подходи на преподаване за трансфер на знания и развитие на умения (Walczak & Cellary 2023) и насърчава изследванията за ролята на ИИ в образованието (Elmessiry & Elmessiry 2024).
Преподавателите и студентите оценяват неговите ползи за оптимизация на работата при изпълнение на задачи, намаляване на времето за разработка на учебно съдържание, предоставяне на персонализирани учебни пътища на базата на специфични нужди и стилове на учене, връщане на обратна връзка, изпълнение на задания и съсредоточаване върху задължения, които не могат да бъдат автоматизирани. За да повишат мотивацията на студентите по време на учебния процес, изследователите (Diwan et al. 2023) предлагат интегриране на ИИ инструменти в обучението за генериране на спомагателни учебни текстове и текстове за размисъл, които се оценяват от човешки оценители. ИИ инструментите могат да генерират въпроси за оценяване и самооценяване на знанията на студентите на базата на различни входни данни (Zhou et al. 2018). Генерирането на въпроси към учебно съдържание започва със синтактичен и семантичен анализ за извличане на основни характеристики на лексемите, пренареждане на лексемите и формиране на въпрос според предварително изградени правила за трансформация или шаблони. ИИ инструментите могат да изпълняват и други задачи, като оценяване на знанията на студенти, предоставяне на автоматизирана обратна връзка, разработване на интерактивни образователни игри, създаване на визуализации и др. (Owoc et al. 2019). В обучението по инженерни и компютърни науки ИИ може да се използва за генерирането на програмен код и обяснения, както и за тестване на разработен софтуерен продукт (Bahroun et al. 2023). Интегрирането на ИИ инструменти при изучаване на езици осигурява възможност на студентите да участват в разговори с виртуални преподаватели по езици и да получават обратна връзка за области за подобрение. ИИ инструментите могат да приспособят учебните дейности за постигане на специфични цели за изучаване на езици и да генерират учебен материал, който да се използва за придобиване на умения за слушане, говорене, четене и писане (Yanhua 2020). ИИ инструментите за превод от реч към текст и жестомимичен език позволяват на студенти с увреден слух да участват пълноценно в учебния процес (Levine et al. 2023). В допълнение, инструментите за превод от реч в текст са полезни за запис на лекции (Jelovšek et al. 2023), изучаване на чужди езици (Widyana et al. 2022). Не на последно място, подобни инструменти са полезни и за изследователската работа на академичния състав (Gaber et al. 2020), тъй като им позволяват да документират идеи и концепции по време на срещи и да транскрибират интервюта за събиране на качествени данни за научни изследвания. От друга страна, инструментите за преобразуване на текст в реч улесняват преподавателите при разработване на аудио и видео лекции. Hamerman, Aggarwal и Martins (Hamerman et al. 2025) изследват факторите, които влияят върху използването на ИИ инструменти от студенти и техните възприятия за това как ИИ може да улесни ученето, и констатират, че висшите училища трябва да определят политики, които да установят граници за използването на ИИ, да насърчават и обучават преподавателите да интегрират ИИ инструменти в учебния процес (напр. за изпълнение на задачи от студенти).
Въпреки потенциала на ИИ инструментите за насърчаване на автономно, съвместно и интерактивно обучение (Peláez-Sánchez IC et al. 2024), тяхното използване по време на учебния процес крие рискове, свързани с достоверността на генерираното съдържание, спазването на етични и правни норми. Преодоляването на тези рискове изисква насърчаване на цифровата грамотност и предлагане на ефективни решения за етично използване на ИИ инструментите, които да гарантират поддържане на високо ниво на образованието и академична почтеност.
Настоящата статия представя възможности за приложение на генеративни ИИ инструменти в образованието, изследва потенциални проблеми при тяхното използване и представя решения за тяхното преодоляване. Основно място е отделено на необходимостта от разработване на политики и стратегии за ефективно използване на ИИ във ВУЗ като фактор за насърчаване на иновации в обучението, както и от методики и инструменти за автоматизирано оценяване на качеството на генерираното с ИИ учебно съдържание.
2. ИИ инструменти
Ключови технологии, които са в основата на всички иновативни инструменти за генериране и обработка на текст, са големите езикови модели (LLM) и генеративните предварително обучени трансформатори (GPT). Големите езикови модели са подгрупа от модели за дълбоко обучение, разработени за изпълнение на задачи за обработка на естествен език, като машинен превод, обобщаване на текст и отговаряне на въпроси. Сред ключовите нововъведения в тези модели са използването на техника за самоконтрол, която позволява на моделите да се учат от голям набор немаркирани набори от данни чрез използване на присъщата структура на самите данни, и механизъм за улавяне на дългосрочни зависимости (трансформатор) в рамките на последователности, който преодолява ограниченията на повтарящите се невронни мрежи и позволява ефективно паралелизиране по време на обучение (Walczak & Cellary 2023). Тези иновации дават път за развитие на високоефективни големи езикови модели, като BERT и GPT-3, които се използват в много ИИ инструменти. GPT голям езиков модел, разработен от компанията OpenAI, който демонстрира изключителни способности за учене. Според технически доклад GPT-4 може да приема входни данни от текст и изображения и да генерира текстови отговори на разбираем човешки език, като неговата архитектура и количеството използвани данни за обучението му не са разкрити от OpenAI1. Генераторите на изображения използват техники за дълбоко обучение, като вариационни автоенкодери (VAE) и генеративни състезателни мрежи (GANs) (Walczak & Cellary 2023).
Редица ИИ инструменти с широко предназначение намират приложение в образованието.
Разработеният от OpenAI чатбот ChatGPT2 с генеративен ИИ се основава на езиковия модел GPT-4o. Чат ботът генерира отговори на зададени от по-требителя въпроси и му позволява да прецизира и насочва разговора към желаната дължина, формат, стил, ниво на детайлност и език. Gemini3 е чатбот с генеративен изкуствен интелект, разработен от Google, базиран на едноименния голям езиков модел, който може да отговаря на потребителски въпроси, да превежда текст от един на друг език, генерира съдържание (текстове на естествен език, програмен код, изображения и музикални произведения). Тези чат ботове намират приложение при разработване на текстово съдържание за учебни материали или изпълнение на задачи, отговаряне на запитвания на студенти и предоставяне на персонализирана подкрепа в реално време.
Друга група ИИ инструменти могат да подпомогнат разработването на научни текстове. Инструментът Grammarly4 използва сложни алгоритми за разбиране и тълкуване на текст, написан на английски език, които анализират граматиката, синтаксиса и семантичната кохерентност на текст, откриват правописни, граматични и пунктуационни грешки и дават препоръки за стилови промени на текста за повишаване на неговата четимост. Jenni AI5 и Paperpal6 са други интелигентни помощници за писане, които подобряват четливостта и съгласуваността на текста, като редактират граматични, пунктуационни и стилови грешки и позволяват на потребителите да усъвършенстват своите умения за писане и създаване на висококачествено съдържание. Чат ботът ChatPdf.com7 дава отговори на научни въпроси и улеснява разбирането на научен текст. Humata.ai8 може да прочита и синтезира най-важната информация от текст, да сравнява документи, да търси отговори на въпроси и да показва първоизточника, в който е открил отговора. Други популярни интелигентни асистенти за четене с мощни възможности за търсене и обобщаване на научни текстове са Scholarcy9, Casper10 и SciSpace11, като Casper и SciSpace улесняват разбирането на пасажи от текст.
Приложение в образованието намират и моделите за разработване на изображения от текст (като DALLE-2 и Dreamfusion), генериране на текст от изображение (Flamingo), аудио и видео от текст (като Phenaki и AudioLM), инструментите за преобразуване на текст в реч и обратно. Инструментът за конвертиране на гласови бележки в текст Audiopen12 използва интелигентни писалки за запис на писмени бележки. Така студентите могат да преразгледат избрани части от лекциите, като кликнат върху добавените писмени бележки (Alaswad et al. 2023). Speechify13 преобразува текст в реч, като по този начин подобрява достъпността за студенти със зрителни увреждания и дислексия. Инструментът за конвертиране на текст в реч Murf14 поддържа над 120 гласа на повече от 20 езика с етично получени данни, обучени върху автентични лингвистични модели, което улеснява разработването на аудио съдържание на чужд език. Широко приложими инструменти за превод от реч в текст, които разпознават текст на български език, са Google Speech-to-Text, Microsoft Azure Speech Service, Mozilla DeepSpeech, Google Docs Voice Typing, Speechnotes, Dictation.io и Voice Notebook.
В последните години се разработват и много ИИ инструменти с тясно приложение в областта на образованието. Пример за такива инструменти са платформата за генериране на интерактивни планове за уроци с елементи на геймификация Eduaide.Ai15, инструментът за генериране на дидактически материали Fliki AI (Ruiz-Rojas et al. 2023), адаптивната платформа за подобряване на ефективността на обучение по математика Knewton (Annuš 2024), инструментът за разработване на учебни ресурси за изучаване на чужди езици Twee16 . Инструментът Gradescope17 използва машинно обучение и ИИ, за да улесни процеса на оценяване и да спести време на преподавателите за оценяване на изпитни работи и предоставяне на обратна връзка. Инструментът може да се използва и за оценяване на изпитни работи на хартиен носител. Други примери за ИИ инструменти, разработени за нуждите на образованието, са виртуалните асистенти за подобряване на уменията за критично мислене на студенти Cognii18 и чатботът за решаване на математически задачи MathGPTPro19 .
3. Проблеми и предизвикателства при генериране на съдържание
Въпреки многото ползи за учебния процес към настоящия момент използването на ИИ инструменти крие рискове.
Осигуряването на високо качество на съдържанието, независимо дали е написано от човек, или е генерирано с ИИ, е от решаващо значение за постигането на високи резултати от обучението. Констатациите от проведени изследвания разкриват значителна загриженост сред висшите училища по отношение на достоверността и качеството на генерираното съдържание. Според резултати на едно такова изследване едва 16% от генерираното съдържание отговаря на поставените критерии за качество (Peláez-Sánchez 2024). Представената информация трябва да бъде достоверна, релевантна, четлива, да не съдържа правописни и граматични грешки и същевременно да отговаря на етични стандарти.
ИИ инструментите не могат да оценят валидността на съдържанието и да определят дали генерираният изходен резултат съдържа недостоверна информация (Chan & Hu 2023). Друго основно ограничение на ИИ инструментите е свързано с тенденцията за генериране на математически, изчислителни и концептуални грешки (Maynez et al. 2020). Освен това поради факта, че моделите са обучени въз основа на данни, представляващи определена реалност към даден момент, при използване на ИИ има потенциална опасност моделите да върнат недостоверен отговор. Поради това, ако съдържанието не бъде критично оценено, има риск от получаване на недостоверни резултати.
Въпреки че резултати от проведени експерименти показват, че инструментите за ИИ демонстрират високо ниво на езикова точност и връщат добре конструирани и граматически издържани отговори, при генериране на съдържание могат да възникнат случайни неточности (Sarwari 2024). Така например при поставяне на задача за генериране на дълъг текст по зададена тема има потенциална опасност да възникнат проблеми със съгласуваността на абзаците и генерираното съдържание да съдържа повтаряща се или излишна информация, перифразирана по различен начин.
Друго потенциално безпокойство е свързано с факта, че ИИ инструментите може да генерират съдържание, без да разбират задълбочено педагогическите практики, които са в основата на ефективното преподаване. В резултат на това генерираното съдържание може да не позволява постигане на заложените в учебната програма образователни цели.
Академичната общност е притеснена и от прекомерната употреба на ИИ инструменти, като ChatGPT, за изпълнение на домашни работи и възможностите за измами. Yeadon и негови колеги (Yeadon et al. 2024) изследват доколко независими оценители могат да разпознаят дали предадено от студент есе е генериран от ИИ. Резултатите от проведения експеримент не само показват сближаването на качеството на съдържание, генерирано с ИИ и написано от човек (p-стойност =0,107, α = 0,05), но и подчертават трудността при разпознаване на генерирано от ИИ съдържание, неефективността на този метод за оценяване и прилагането на нови форми на оценяване.
Не на последно място, висшите училища са изправени пред правни предизвикателства по отношение на интелектуалната собственост, използването и защитата на произведения и изображения, генерирани от ИИ. Тези проблеми възникват поради несигурността в настоящите закони за авторското право в случаите, когато те се прилагат към генерирано с ИИ съдържание.
4. Решения
За преодоляването на посочените проблеми в ерата на ИИ е необходимо да бъдат въведени строги процеси за контрол на качеството, които да гарантират, че генерираното съдържание отговаря на определени стандарти за достоверност, релевантност и четливост. Тези процеси включват стриктен преглед на съдържанието за откриване и коригиране на грешки, пристрастия или несъответствия. Подходящи механизми за оценка на качеството на съдържанието са партньорската проверка и валидирането от експерти.
Разработването на съдържание с използване на ИИ е итеративен процес. Достоверността на върнатия отговор в голяма степен се определя от поставената задача (Dai et al. 2023; Tai et al. 2023). Това изисква наличие на умения за формулиране на ефективни насочващи въпроси на базата на текущия отговор, познаване на капацитета, начина на работа и ограниченията на ИИ инструментите. Така например при поставяне на задача за програмиране за получаване на коректно решение на определен език за програмиране е необходимо да бъде посочен и езикът за програмиране, на който да бъде съставена програмата. Въпреки постоянното усъвършенстване на алгоритмите за генериране на достоверно съдържание, потребителите на ИИ инструменти трябва да притежават умения за критично мислене, оценяване на валидността на генерираното съдържание, да имат знания в областта на генерирания текст / изпълняваната задача, за да могат да откриват разликите между фактически точна и подвеждаща информация и не на последно място, да имат натрупан опит за работа с ИИ инструментите. Проверката за достоверност на генерираното съдържание изисква критично прочитане на съдържанието с цел откриване на съмнителна информация, потенциални пристрастия, грешки или несъответствия. Всички факти и твърдения трябва да бъдат проверени в източници с надеждна информация и информацията от различни надеждни източници да бъде сравнена чрез кръстосани препратки. В случай че генерираното съдържание съдържа изображения, те също трябва да бъдат внимателно прегледани за коректност, вкл. с цел избягване на възможности за създаване на непреднамерени пристрастия. Докато традиционните подходи за оценяване на качеството на изображения се фокусират върху свойствата на самото изображение, като замъгляване, шум и изкривяване, при оценяване на изображения, генерирани от ИИ, интерес представлява самото съдържание на изображението. За да повишат доверието на потребителите към ИИ, Combs и негови колеги (Combs et al. 2024) предлагат рамка за количествено определяне на несигурността при генериране на изображение от ИИ инструменти, състояща се от 4 модула – генериране на изображение от текст, генериране на етикет на изображението, оценка на качеството на изображението и методи за оценка на етикета. За да измерят несигурността, те сравняват текстовата подкана за генериране на текст към изображение с етикети, предоставени от четири модела за създаване на изображение към текст (GIT, BLIP, BLIP-2 и InstructBLIP). Оценката се основава на показатели за машинен превод (BLEU, ROUGE, METEOR и SPICE) и косинусово сходство на вградени думи (Word2Vec, GloVe, FastText, DistilRoBERTa, MiniLM-6 и MiniLM-12). В друго изследване Combs (Combs et al. 2024) предлага методика за оценяване на качеството на генерирани с ИИ инструменти изображения. Те оценяват 9800 изображения, генерирани с помощта на моделите DALL-E 2 и Craiyon, по 3 критерия – брой обекти, разделителна способност и представителност (отчитане на това колко добре изображението съответства на етикета/подканата). Резултатите показват, че DALL-E 2 (платен) произвежда набор от данни с по-малко обекти на изображение, по-висока разделителна способност и по-висока представителност в сравнение с Craiyon (безплатен).
Генерираното съдържание трябва да бъде логическо свързано, без езикови грешки и да има ниско семантично сходство между отделни абзаци. Поради това, то трябва да бъде оценено за кохезия и кохерентност, четливост и сходство.
Кохезията се отнася до лингвистичните връзки, които се използват за свързване на думите и изречения за получаване на свързан текст и се постига чрез повторение на думи, местоимения, съюзи, преходни думи или фрази, синоними, лексикални връзки. За оценка на кохезията могат да се използват метрики, базирани на припокриване на думи (Lexical Overlap – лексикално припокриване), на връзки между думи (Co-occurrence Networks – мрежи на съвместна поява, Lexical Chains – лексикални вериги), на граматически връзки (Pronoun Resolution – разрешаване на местоимения, Connective Frequency – честота на съюзи) и езикови модели, като BERT.
Кохерентността на текста измерва колко добре се свързват идеите в текста, за да образуват смислен и разбираем цялостен текст. Логически свързаното съдържание има ясно дефиниран логичен поток на отделните изречения и абзаци, използва свързващи думи и фрази и е значимо за читателя. За да се осигури логичен поток на текста, представената информация трябва да бъде структурирана по последователен начин, идеите да бъдат логически организирани, да има плавен преход между отделните параграфи, да се поддържа последователен ход на мисълта. Кохерентността може да бъде оценена на базата на три основни вида метрики – измерващи припокриването на думи и концепции (Lexical Overlap – лексикално припокриване, и Entity Grid – решетка на същности), базирани на модели на свързаност (Entity-based Coherence Models и Graph-based Coherence Models) и на векторни представяния (Cosine Similarity – косинусово сходство). За поставяне на по-прецизна оценка кохерентността на текста може да бъде оценена и от хора на базата на предварително зададена скала за оценяване. Важно е да се отбележи, че кохерентността е комплексно понятие и за да бъде оценена, понякога е необходимо да бъдат използвани различни метрики.
Оценката на семантичното сходство изисква да бъде определено дали отделни части от текст имат едно и също значение, или не. Семантичното сходство може да бъде оценено чрез метрики, базирани на припокриване на думи (Jaccard Index – индекс на Джакард, Cosine Similarity – косинусово сходство, и Overlap Coefficient – коефициент на припокриване), на разстояние (Edit Distance – разстояние на редактиране, Hamming Distance – разстояние на Хаминг), на векторни представяния (Word2Vec, GloVe, FastText, Sentence-BERT) и на езикови модели (BERT и BLEURT). Изборът на подходяща метрика зависи от конкретната задача. За задачи, в които се изисква да се измери само припокриването на думи, могат да бъдат достатъчни метрики като Jaccard Index или Overlap Coefficient, но за такива, в които е важно да бъдат отчетени семантичното значение и контекстът, по-подходящи са метрики, базирани на векторни представяния или езикови модели. Поради факта, че базираните на векторни представяния метрики улавят по-добре контекста и значението, те често дават по-добри резултати в сравнение с метриките, базирани на припокриване на думи. За по-пълна оценка на семантичното сходство е желателно да бъдат използвани няколко метрики.
За да бъде четливо за целевата аудитория, оценителят на съдържанието трябва да се увери, че то е представено на подходящ език, не съдържа правописни и граматически грешки, изреченията са с уместна дължина, не съдържа неправилно използвани идиоми, жаргони, фразеологични глаголи и сложни термини, не са използвани двусмислени формулировки, неестествено звучащи изрази и текстът не е написан на абстрактен стил. За оценка на четливостта на текста се използват метрики, които измерват дължина на думите, дължина на изреченията и сложност на синтаксиса. Популярни метрики са индексът Flesch Reading Ease (оценява четливостта на текста на базата на средната дължина на изреченията и средния брой срички на дума) и индексите за оценка на нивото на образование, необходими за разбиране на текста – Flesch-Kincaid (преобразува резултата от Flesch Reading Ease в приблизително ниво на американски клас), Gunning Fog (оценява на базата на средната дължина на изреченията и процента на сложните думи с три или повече срички), Coleman-Liau (използва средната дължина на думите (в символи) и средната дължина на изреченията), SMOG (оценява на база броя на думите с три или повече срички в тридесет изречения) и Automated Readability Index (използва средната дължина на думите (в символи) и средната дължина на изреченията). При необходимост текстът трябва да бъде пренаписан, така че да отговаря на нуждите на целевата аудитория, напр. чрез опростяване на сложни термини и структури на изречения за подобряване на четливостта.
С цел поддържане на етични стандарти редакторите трябва да внимателно да проверят съдържанието за потенциални етични проблеми, като обиден или дискриминационен език.
Поради широкото използване на ИИ инструменти от студенти изследователи в областта (Adeshola & Adepoju 2023) насърчават разработване на ясни политики и насоки за оценяване, които да определят ясни ограничения за използване на ИИ. Избягването на плагиатството е от решаващо значение при генериране на съдържание с помощта на ИИ. При използване на ИИ за подпомагане процеса на разработване на съдържание за учебни материали и курсови проекти с цел гарантиране на оригиналност на финалния вариант на съдържанието и предотвратяване на правни проблеми са необходими щателни проверки за автентичност и уникалност на съдържанието. При използване на защитени с авторски права и съществуващи материали потребителите трябва да спазват законодателството за авторското право и принципите за правилна употреба. Следването на тези практики намалява риска от неволно плагиатство или нарушаване на авторски права при използвате на съдържание и същевременно помага за подобряване на цялостните процеси за контрол на качеството на генерирани от ИИ материали.
Процесите за проверка да бъдат подпомогнати от софтуерни инструменти, които могат да идентифицират потенциални проблеми и несъответствия и да предложат варианти за подобрения, да проверят факти чрез кръстосано препращане на информацията в съдържанието с надеждни източници и да анализират използвания език за откриване на пристрастия, несъответствия или подвеждаща информация. Въпреки съществуващите метрики за измерване оценката на кохерентността и кохезията не може да бъде напълно автоматизирана, защото изисква разбиране на значението и контекста. Някои текстообработващи системи (като Word) предлагат вградени функции за изчисляване на индекси за четливост. Стойностите на показателите за четливост могат да бъдат изчислени и от редица онлайн инструменти, като ReadAbilityScoreChecker, които измерват доколко текстът е лесен за разбиране, въз основа на фактори като дължина на изречението, сложност на думата и цялостна структура. За коригиране на правописни и граматически грешки могат да помогнат вградените в текстообработващи системи инструменти или ИИ инструменти като Gramarly, които дават предложения и за цялостно подобряване на текста. Проверките за плагиатство могат да бъдат подпомогнати от специализирани инструменти като Turnitin и StrikePlagiasrism, които сравняват генерираното съдържание с налично съдържание в бази данни и идентифицират всички случаи на сходство. Използвани показатели в тези системи са показателите за уникалност (Uniqueness), които оценяват дали съдържанието предлага оригинални идеи или фрази. NLP Cloud предлага и API за оценка на семантично сходство, което позволява извършване на семантично сходство веднага на базата на модели на Sentence Transformers, като Paraphrase Multilingual Mpnet Base v2 и др. Безспорно използването на подобни инструменти намалява времето за проверка и позволява подобряване цялостното качество на съдържанието, но прецизна оценка може да бъде дадена само от професионални редактори. Те играят решаваща роля в цялостния процес за осигуряване на качеството, като оценяват съдържанието за подходящ стил на изказване, културни препратки и идиоматичен език, спазване на етичните стандарти, предотвратяват публикуването на потенциално вредна или подвеждаща информация, вливат емоционална интелигентност и редактират съдържанието, така че то да отговаря на желаните стандарти за качество. Изследователите подчертават необходимостта от разработване на рамки и методологии, които се занимават с оценка на качеството на генерираното съдържание и гарантират отговорно и информирано използване на съдържание, генерирано от ИИ (Walczak & Cellary 2023).
За преодоляване на предизвикателства, свързани с факта, че ИИ не разбира педагогическите принципи, преподавателите трябва да могат да преглеждат, променят или одобряват съдържание, генерирано от системи с изкуствен интелект. В тази връзка, изследователи в областта предлагат разработването на методологии за оценка и подобряване качеството на генерираното от ИИ съдържание, стратегии за укрепване на дигиталната грамотност сред учениците и преподавателите и провеждат проучвания, изследващи дългосрочното въздействие на ИИ върху резултатите от обучението (Peláez-Sánchez 2024).
5. Заключение
Въпреки ползите за подобряване качеството на учебния процес, интегрирането на ИИ инструменти крие рискове, свързани с достоверност, релевантност и четливост на генерираното съдържание и спазване на етични стандарти. За осигуряване качеството на генерираното съдържание и поддържане на високо ниво на качество на образованието е необходимо да бъдат приети политики и стратегии, които да регламентират използването на ИИ инструменти, да бъдат разработени методики за автоматизирано оценяване качеството на генерираните с ИИ материали. Процесите за проверка на генерираното съдържание могат да бъдат подпомогнати от софтуерни инструменти, които да идентифицират потенциални проблеми и несъответствия и да предложат варианти за подобрения. Съществуващите софтуерни инструменти и метрики за оценка са предпоставка за проектиране и разработване на интегрирана система за оценяване на качеството на материали, генерирани с ИИ инструменти.
Благодарности и финансиране
Изследването е финансирано от Европейския съюз – NextGenerationEU, чрез Националния план за възстановяване и устойчивост на Република България, проект № BG-RRP-2.004-0001-C01.
БЕЛЕЖКИ
1. GPT-4 Technical Report, https://doi.org/10.48550/arXiv.2303.08774
2. ChatGPT, https://chatgpt.com/
3. Gemini, https://gemini.google.com/
4. Grammarly, https://www.grammarly.com/
5. Jenni AI, https://jenni.ai/
6. Paperpal, https://paperpal.com/
7. ChatPdf.com, https://www.chatpdf.com/
8. Humata.ai, https://www.humata.ai/
9. Scholarcy, https://www.scholarcy.com/
10. Casper, https://casperai.xyz/
11. SciSpace, https://scispace.com/
12. Audiopen, https://audiopen.ai/
13. Speechify, https://speechify.com/
14. Murf, https://murf.ai/
15. Eduaide.Ai, https://www.eduaide.ai/
16. Twee, http://twee.com
17. Gradescope, https://www.gradescope.com/
18. Cognii, https://www.cognii.com/
19. MathGPTPro, https://www.info.mathgptpro.com
Acknowledgements & Funding
This study is financed by the European Union-NextGenerationEU, through the National Recovery and Resilience Plan of the Republic of Bulgaria, project № BG-RRP-2.004-0001-C01.
REFERENCES
ADESHOLA, I. & ADEPOJU, A., 2023. The opportunities and challenges of ChatGPT in education. Interactive Learning Environments, vol. 32, no. 10, pp. 6159 – 6172. ISSN 1049-4820.
ALASWAD, S., et al., 2023. Using ChatGPT and other LLMs in Professional Environments, Information Sciences Letters, vol. 12, no. 9, pp. 2097 – 2108. ISSN 2090-9551.
ANNUŠ, N., 2024. Educational Software and Artificial Intelligence: Students‘ Experiences and Innovative Solutions. Information Technologies and Learning Tools, vol. 101, no. 3, pp. 200 – 226. ISSN 2076-8184.
BAHROUN, Z., et al., 2023. Transforming Education: A Comprehensive Review of Generative Artificial Intelligence in Educational Settings through Bibliometric and Content Analysis. Sustainability, vol. 15, no. 17. ISSN 2071-1050.
CHAN, C., & HU, W., 2023. Students’ voices on generative AI: Perceptions, benefits, and challenges in higher education. International Journal of Educational Technology in Higher Education, vol. 20, no. 1. ISSN 2365-9440.
COMBS, K., et al., 2024. A Human-Factors Approach for Evaluating AI-generated Images. New York: Association for Computing Machinery. ISBN 979-8-4007-0477-2.
COMBS, K., et al., 2024. Uncertainty in Visual Generative AI. Algorithms, vol. 17, no. 4, Article 136. ISSN 1999-4893.
DAI, Y., et al., 2023. Reconceptualizing ChatGPT and generative AI as a studentdriven innovation in higher education. Procedia CIRP, vol. 119, pp. 84 – 90. ISSN 2212-8271.
DIWAN, C., et al., 2023. AI-based learning content generation and learning pathway augmentation to increase learner engagement, Computers and Education: Artificial Intelligence, vol. 4, Article 100110. ISSN 2666-920X.
ELMESSIRY,A. & ELMESSIRY, M., 2024. Navigating the Evolution of Artificial Intelligence: Towards Education-Specific Retrieval Augmented Generative AI (ES-RAG-AI. NTED2024 Proceedings, pp. 7692 – 7697. ISSN 2340-1079.
GABER, M., et al., 2020. Speech-to-Text technology as a documentation tool for interpreters: A new approach to compiling an ad hoc corpus and extracting terminology from video-recorded speeches. TRANS: revista de traductología, vol. 24, pp. 263 – 281. ISSN 2603-6967.
HAMERMAN, E., et al., 2025. An investigation of generative AI in the classroom and its implications for university policy, Quality Assurance in Education, vol. 33, no. 2, pp. 253 – 266. ISSN 0968-4883.
JELOVŠEK, T., et al., 2023. Online-Notes System: Real-Time Speech Recognition and Translation of Lectures. Cham: Springer Nature Switzerland. ISBN 978-3031-33080-3.
LEVINE, S., et al., 2023. How high school students used speech-to-text as a composition tool. Computers and Composition, vol. 68, Article 102775. ISSN 8755-4615.
MAYNEZ, J., et al., 2020. On faithfulness and factuality in abstractive summarization. Proc. of the 58th Annual Meeting of the Association for Computational Linguistics, pp. 1906 – 1919. ISBN 978-1-952148-25-5.
OWOC, M., et al., 2019. Artificial intelligence technologies in education: benefits, challenges and strategies of implementation. Cham: Springer International Publishing. ISBN 978-3-030-85000-5.
PELÁEZ-SÁNCHEZ, I., et al., 2024. The impact of large language models on higher education: exploring the connection between AI and Education 4.0. Frontiers in Education, vol. 9. ISSN 2504-284X.
RUIZ-ROJAS, L., et al., 2023. Empowering Education with Generative Artificial Intelligence Tools: Approach with an Instructional Design Matrix. Sustainability, vol. 15, no. 15. ISSN 2071-1050.
SARWARI, K., 2024. Using AI Tools for Teaching and Learning: A Systematic Review of Literature. Journal of Cognition, Emotion & Education, vol. 3, no. 1, pp. 43 – 56. ISSN 2993-3943.
TAI, A., et al., 2023. Exploring the potential and limitations of ChatGPT for academic peer-reviewed writing: Addressing linguistic injustice and ethical concerns. Journal of Academic Language and Learning, vol. 17, no. 1, pp. T16 – T30. ISSN 1835-5196.
WALCZAK, K., & CELLARY, W., 2023. Challenges for higher education in the era of widespread access to Generative AI. Economics and Business Review, vol. 9, no. 2, pp. 71 – 100. ISSN 2392-1641.
WIDYANA, A., et al., 2022. The application of text-to-speech technology in language learning. Advances in Social Science, Education and Humanities Research, vol. 722, pp. 85 – 92, ISSN 2352-5398.
YANHUA, Z., 2020. The application of artificial intelligence in foreign language teaching. In 2020 International Conference on Artificial Intelligence and Education (ICAIE), pp. 40 – 42. ISBN:978-1-7281-6659-9.
YEADON, W., et al., 2024. Evaluating AI and human authorship quality in academic writing through physics essays. European Journal of Physics, vol. 45, no. 5. ISSN 1361-6404.
ZHOU, Q., et al., 2018. Neural question generation from text: A preliminary study. Lecture Notes in Computer Science, vol. 10619, pp. 662 – 671. ISSN 1611-3349.