Български език и култура по света

АВТОМАТИЧНО РЕЧЕВО РАЗПОЗНАВАНЕ В ПОМОЩ НА ОСЪЗНАВАНЕТО НА СЕГМЕНТНИ ПРОИЗНОСИТЕЛНИ ОТКЛОНЕНИЯ ПРИ ИЗУЧАВАНЕ НА БЪЛГАРСКИЯ ЕЗИК КАТО ЧУЖД

Мирена Пацева

РИНЦ eLIBRARY ID: 36725638
Sofia University „St. Kliment Ohridski“
15 Tsar Osvoboditel
1504 Sofia
ORCiD: 0000-0001-6214-3240
WoSID: S-3912-2019 HZJ-7758-2023
SCOPUS: 57191609214
E-mail: mirena.patseva@slav.uni-sofia.bg

https://doi.org/10.53656/bel2026-1-6-MP

Резюме. Статията разглежда използването на технологичен инструмент, базиран на автоматично речево разпознаване в преподаването на български език като чужд. Проследява се учебна практика с китайски специализанти, които учат български език, и въпреки усилията си имат сериозни произносителни затруднения. Практиката има за цел да проследи самостоятелното осъзнаване на произносителни отклонения при четене на текст на Е2 чрез технология за транскрибиране на реч. Студентите съпоставят записа на своя прочит с оригиналния текст, отбелязват отклоненията и правят опит да ги обобщят и да обяснят причините за допускането им. Подчертават се ползите от технологията като обратна връзка в реално време, намаляване на зависимостта на студентите от учителя за корекции, възможността за многократни упражнения без неудобство пред групата и персонализиран подход към индивидуалните трудности. Предлага се корективна работа по няколко направления, както и задачи за осъзнаване и за автоматизиране на коректното произношение.

Ключови думи: произношение на Е2; автоматично речево разпознаване; осъзнаване на произносителни отклонения; преподаване на български език като чужд

Технологиите в ЧЕО

Използването на съвременните технологии в ЧЕО безспорно разширява възможностите и обогатява учебната среда. То позволява включването на автентични езикови материали (филми, подкасти, новини, музика), онлайн комуникация с носители на езика във видеоконферентни платформи и създаване на интерактивна учебна среда чрез образователни платформи и приложения. Адаптивни системи, които се настройват според нуждите и прогреса на учещите, повишават мотивацията чрез персонализиране на обучението. Тук се представя прилагането на технология за преобразуване на реч в писмен текст, базирана на автоматично речево разпознаване (АРР) за осъзнаването на сегментни произносителни отклонения при изучаване на българския език като чужд (БЕЧ)

Какво представлява автоматичното речево разпознаване?

Автоматичното речево разпознаване е технология, която използва изкуствен интелект и машинно обучение за преобразуване на устна реч в писмен текст. Познаваме я от ежедневието си – на нея се основават виртуални асистенти като Siri, Alexa, Google Assistant, инструменти за диктовка и транскрипция като Google Docs – Voice typing, за субтитри, превод в реално време, клиентски услуги и гласови автоматични системи като Rech. Технологията анализира звуковата реализация, идентифицира думи и ги превежда в цифров формат. Тя включва: акустична обработка – преобразуване на звука в цифрови сигнали; фонемен анализ – разделяне на речта на минимални звукови единици и сравняването им с еталонни модели; езиково моделиране – предвиждане на вероятния текст чрез статистически и контекстуални модели и алгоритми (N-грами, невронни мрежи).

Автоматичното речево разпознаване в чуждоезиковото обучение

Сред сферите на използване на АРР в чуждоезиковото обучение е автоматичното транскрибиране на учебни материали – например за преобразуване на автентични аудио материали в текст за по-лесно разбиране и преодоляване на трудностите при слушане. Чрез АРР се създават субтитри за видео материали на втория език (Е2). Технологията може да персонализира ученето, като подкрепя студенти с различни стилове на възприемане, особено тези, които имат нужда от визуален вход, съпровождащ аудио информация.

АРР има място при перцептивните учебни дейности, както и при продуктивните. Тук се фокусираме върху възможностите му за подпомагане на произношението и по-конкретно на осъзнаването на сегментни особености на Е2 и на собствените отклонения от тях. Осъзнаването на последните не е лесно, защото учещите невинаги ги възприемат – просто не ги „чуват“ поради спецификата на възприятието като активен процес. Ние активно налагаме своите устойчиви звукови модели от Е1, усвоени от най-ранна възраст, върху постъпващата информация – звуковия поток на Е2. Затова замяната на един сегмент с друг се възпроизвежда многократно въпреки корекциите на учителя. Това се наблюдава отчетливо, особено когато има съществени различия във фонологичните системи на Е1 и Е2. Например носители на японски и китайски език произнасят названието на планината Рила като Лила, като отклоненията се отразяват и в графиката. Корективните усилия са наложителни, защото в редица случаи фонетичната замяна затруднява разбирането (например при рак / лак).

Както отбелязва Флеге, необходими са нови методи за изследване и подобряване на произношението на Е2 (Flege 2019, 2021, р. 120). Чрез АРР можем да ангажираме допълнителен визуален код, който да онагледи отклоненията при произношението и да фокусира вниманието върху проблемните области. Тук проследяваме как се случва това в преподаването на БЕЧ на студенти от Китай.

Учебна практика: цел, участници, материал

Практиката има за цел да проследи самостоятелното осъзнаване на произносителни отклонения при четене на текст на Е2 чрез технологични средства. Участниците са китайски специализанти в Софийския университет. Те са общо седем души – едно момче и шест момичета на възраст около 20 години. Преди пристигането си в София всички са преминали една академична година интензивно обучение по български език – трима от тях в Пекинския университет за чужди езици (по 14 учебни часа седмично), а останалите – в Тиендзинския университет за чужди езици.

Материалът е аудио запис на прочит на кратка история – вариация на Езопова басня. Текстът предварително се използва за диктовка, при която се слуша с нормална скорост преди и след диктовката с още две повторения при писането. Новата лексика се обяснява и записва. По-късно студентите четат познатия текст пред записващо устройство, след което записът се трансформира в писмена форма от инструмент за автоматично речево разпознаване TurboScribe. Това е приложение за транскрипция на основата на Whisper, което работи с различни файлови формати: mp3, wav, mp4. За съпоставка на резултатите същият инструмент се използва и за транскрибиране на прочита на български говорители – две момчета и две момичета, които също са студенти в СУ.

На следващо занятие всеки китайски специализант получава оригиналния текст и графичния запис на своя прочит със следните задачи:

1. да се съпоставят двата текста;

2. да се отбележат отклоненията в собствения прочит;

3. да се обобщят отклоненията и

4. да се направи опит за тълкуване защо се получават те.

Резултати

Автоматичната транскрипция на собствения прочит в редица случаи предизвиква стъписване и въпрос „Наистина ли говоря така?“. В някои от прочитите отклоненията са обозрими. Те се илюстрират с транскрипция на записа на една от отличните китайските говорителки (КГ1-П). В други случаи обаче цели пасажи от текста са напълно неразбираеми (КГ2-Х). За съпоставка се прилага и транскрипцията на записа на българска говорителка (БГ), като отклоненията са отбелязани с bold:

Естествено, броят на отклонения е значително по-малък при българската говорителка. Те са само 9. Две от тях са елизии: кой е се произнася слято, като глайдът се изпуска – *кое. Финалната гласна на членната морфема в дрехата не се реализира и единицата е записана като *дрехът. Не се реализира пълният член при Северния(т) вятър. Необичайното консонантно съчетание -сч- се записва като щ в *щита (вместо счита). Фиксирана е и замяна на [у] с [о] при *овиваше, *осилията (вместо увиваше, усилията) Отклоненията не затрудняват разбирането на текста.

При първата китайската говорителка (КГ1-П) отклоненията са 32 на брой. Част от тях са обобщени от самата студентка по следния начин: замяна на д↔т, б↔п, р↔л. Илюстрираме ги с конкретни примери:

• р↔л препилаха (препираха), влинутен (принуден), влизнае (признае),

• б↔п забочна (започна), болзе (после), бътник (пътник)

• д↔т завид (завит), влинутен (принуден), треха (дреха), туха

Освен набелязаните групи отклонения се среща замяна на гласната [ъ] с [е] в *сленцето (слънцето). Наблюдава се също метатеза при *болзе (после) и епентеза на гласна в консонантни комплекси: *съчита (счита). Възприемането на четения текст се затруднява още повече от прозодични отклонения. В транскрипцията се регистрират паузи в думи като ми на (мина) и по-рядко сливания като *така (да грее) . Те са отбелязани от самата студентка като неразбираеми единици заедно с *влинутен (вместо принуден), които чувствително затрудняват възприемането на смисъла на текста. Към тях добавяме и заменени единици като *добра (вместо топла), *свари (вместо свали).

Прочитът на КГ1-П е на един от най-отчетливите в групата на китайските специализанти. В редица други случаи е още по-трудно и на места невъзможно да се разбере смисълът, като инструментът погрешно избира други думи или въобще не дава транскрипция за някои пасажи. Те се илюстрират с прочита на КГ2-Х – студентка, която се справя много добре с българската граматика и с редица умения като четене с разбиране и писане, но има затруднения с произношението. В таблица 1 са сумирани общите сегментни отклонения1, свързани със замяна на р/л, звучни и беззвучни съгласни, както и други случаи на замяна (в→б), елизия, метатеза и епентеза.

Таблица 1. Общи сегментни отклонения на групата китайски специализанти. Подчертаните единици се повтарят. Някои думи се произнасят с повече от едно отклонение – нагала (накара)

Причини за сегментните отклонения

Причините за сегментните отклонения се търсят преди всичко в особеностите на първия език на обучаемите. Китайският мандарин (КМ) е език от сино-тибетското езиково семейство, говорен като първи в Китай, Сингапур, Тайван и др. Фонетичната му система се отличава от българската както по звуков състав, така и по прозодични особености и по структура. Сричките в КМ са 413 на брой, които могат да се произнесат с четири тонални вариации (Song, 2021; Shishkova, 2023). Сричката може да се състои от максимум четири звука, например zhuang [tʂuaŋ]. Инициалите са ограничен брой (21). Към тях се отнасят и две полугласни – билабиалната w и палаталната y. Позволява се наличие на инициал и от една до три гласни след него, като само една от тях е носеща тона. Терминалите са n [n] или ng [ŋ]. (Shishkova, 2023, pp. 74 – 75). За разлика от българския език, инициалът на китайската сричка се състои само от една съгласна. За КМ е смислоразличителна опозицията на непридихателни и придихателни съгласни ([p] и [pʰ], [t] и [tʰ], [k] и [kʰ]), но няма опозиция на звучни и беззвучни съгласни, характерна за българския и за други индоевропейски езици. (Gogova, 1994, p. 16). В стандартния КМ липсва алвеоларно вибрантно [р], както и лабиодентална звучна [в] (Gogova, 1994, p. 20). Българските съгласни звукове [ж, ч, ш] имат само приблизително съответствие в КМ – те са ретрофлексни звукове и се произнасят с извиване на върха на езика назад, но отклоненията в артикулацията им рядко са причина за затруднено разбиране. Средната гласна [ъ] е ретрофлексна в китайския език (Gogova, 1992, p. 28) и се произнася в неударена позиция или в края на сричка. Вероятно затова китайските студенти в СУ я заменят предимно под ударение (*сленце). Набелязаните отличия, които са подробно представени от Снежина Гогова (Gogova, 1992; Gogova, 1994), очертават основните проблемни области за корективна работа в преподаването на БЕЧ.

Какво да се прави след осъзнаването на произносителните отклонения?

Предлага се корективна работа по следните направления.

1. Минимални двойки за различаване на р/л.

2. Минимални двойки за различаване на звучни и беззвучни съгласни.

3. Примери за средната гласна [ъ] под ударение в различни класове думи.

4. Задачи за осъзнаване на семантичните и артикулаторните разлики и за автоматизиране. (1) Минимални двойки за различаване на р/л

Примерни задачи за осъзнаване на семантичните разлики и за автоматизиране

I. Попълнете с гара – кара, БИЛА – бира, вари – вали.

1. Отивам в .......... за ...........

2. Тя .......... супа, докато .......... дъжд

3. Влакът тръгва от Централна .......... . Машинистът .......... влака.

II. В задача за слушане студентите са разделени на две групи – едните записват всички единици с р, другите – с л. Съпоставят се резултатите.

(2). Минимални двойки за различаване на звучни и беззвучни съгласни

б – п: боб/поп, бял/пял, битка/питка, баба/папа, блед/плет в – ф: ваза/фаза, вар/фар, враг/фрак, вал/фал г – к: гора/кора, гара/кара, глас/клас, гид/кит, гол/кол, гола/кола, гледка/клетка д – т: дом/том, дам/там, дъга/тъга, ден/тен, дъб/тъп ж – ш: жест/шест, жабка/шапка, жар/шар, жал/шал, жило/шило, з – с: зова̀/со̀ва, зърна̀/сърна̀, зѐстра/сестра̀ дж -ч джаз/час, джин/чин, джудо/чудо, джанта/чанта

(3) Примери за гласната ъ под ударение в различни класове думи, които могат да се използват за автоматизиране на произнасяне на средната гласна [ъ] под ударение:

Съществителни имена:

Едносрични: мъж, зъб, път, пъп, дъжд, вълк, кръг, грък, сърп, кръв.

Многосрични: бъдеще, четвъртък, ъгъл, щъркел, къща, тъща, гърло, слънце.

Прилагателни имена : дълъг, къс, кръгъл, къдрав, мъдър, тъмен, тънък, стръмен.

Числителни имена : пръв, първи, четвърти.

Местоимения: какъв, какъвто.

Глаголи: бъда, вържа, дърпам, късам, лъжа, обърна, обръщам, пържа, търся.

Наречия: вън, навън, вътре, бързо, дълго, тъмно, тъкмо.

Сред тях също могат да се набележат думи, различаващи се само по наличието или не на гласната [ъ] като път/пот/пет/пат/пит; пъп/поп; пътен/ потен; пътник/потник.

(4) Примерни задачи

1. Задачи с тактилни елементи: при четене на минимални двойки се докосва гърлото, за да се усети вибрацията при звучните съгласни.

2. Студентите сами съставят списъци с думи с корелативни двойки звучни и беззвучни съгласни.

3. В задача за слушане студентите откриват „грешния“ елемент в редицата:

А. вечер, ваза, фар, вълк;

Б. филм, факт, филия, винаги.

4. Игра на телефон: първият в редицата получава дума със звучна или безвучна съгласна и я прошепва на следващия. Последният я казва и пише. Дали е вярна?

Заключение

Може да заключим, че съвременните технологични инструменти имат място в чуждоезиковото обучение. Чрез автоматичното речево разпознаване се диагностицират произносителни отклонения, които дотогава невинаги се осъзнават ясно както от студентите, така и от преподавателите. Последните също имат нужда от ориентир за различните фонологични системи на езиците на студентите. Автоматичното речево разпознаване успешно служи за такъв ориентир, както и за основа на корективната работа. Инструментът дава обратна връзка в реално време, намалява зависимостта от учителя за корекции и позволява многократни индивидуални упражнения без неудобство пред групата. Той позволява на студентите сами да си дадат сметка за това доколко речта им е разбираема и какъв процент от нея се разпознава правилно. Наред с това, технологията служи за прилагане на персонализиран подход и фокусиране върху индивидуалните трудности.

ЛИТЕРАТУРА

Гогова, С. (1992). Относно вокализма в китайския език (в съпоставка с българския език). Съпоставително езикознание (1), 47 – 62.

Гогова, С. (1994). Относно консонантизма на китайския език (в съпоставка с българския език). Съпоставително езикознание, XIX(2), 15 – 22.

Хасанов, Х. & Георгиева, П. В. (2017, 18 май). Гласово разпознаване – историческо развитие и основни техники. Компютърни науки и комуникации, 6(1). https://csc.bfu.bg/index.php/CSC/bg/article/view/38

Шишкова, Я. (2023). Съдържание на обучението по фонетика в начален етап на овладяване на произношението на китайския език. В: Дипломатически, икономически и културни отношения между Китай и страните от Централна и Източна Европа (рр. 59 – 83). Фабер.

REFERENCES

Flege, J. E. (1995). Second-language Speech Learning: Theory, Findings, and Problems. In: Strange, W. (Ed.). Speech Рerception and Linguistic Experience: Issues in Cross-language Research (рр. 229 – 273). Timonium MD: York Press.

Flege, J. (2021). New Methods for Second Language (L2) Speech research. In: R. Wayland (Ed.). Second language speech learning: Theoretical and empirical progress (рр. 119 – 156). Cambridge University Press. DOI: https://doi.org/10.1017/9781108886901.004 [viewed 5 April 2025]. Available from: https://www.researchgate.net/profile/James-Flege/ publication/349040813_New_Methods_for_Second_Language_L2_ Speech_Research/links/6101769e1ca20f6f86e58c52/New-Methods-forSecond-Language-L2-Speech-Research.pdf

Gogova, S. (1992). Оtnosno vokalizma v kitajskia ezik (v sapostavka s balgarskia ezik). Sapostavitelno ezikoznanie, 1, 47 – 62.

Gogova, S. (1994). Оtnosno konsonantisma na kitajskia ezik (v sapostavka s balgarskia ezik). Sapostavitelno ezikoznanie, XIX(2), 15 – 22.

Hasanov, H. & Georgieva, P. V. (2017, May 18). Glasovo razpoznavane – istorichesko razvitie i fikfvni tehniki, Кompyutarni nauki i komunikatsii, 6(1). https://csc.bfu.bg/index.php/CSC/bg/article/view/38

Shishkova, J. (2023). Sadarzhanie na obuchenieto po fonetika v nachalen etap na ovladyavane na proiznoshenieto na kitajskia ezik. In: Diplomaticheski, ikonomicheski i kulturni otnoshenija mezdu Kitaj i stranite ot Tsentralna i Iztochna Evropa, (рр. 59 – 83). Faber.

Song, C. (2021, August 24). Pinyin Syllables. China Highlights. https://www. chinahighlights.com/travelguide/learning-chinese/pinyin-syllables.htm [Accessed 01.02.2025].

Година LXVIII, 2026/1 Архив

стр. 105 - 114 Изтегли PDF