Cieľom príspevku je určiť kritériá pre hodnotenie kvality videa obsahujúceho slovenskú prstovú abecedu, navrhnúť metódu na meranie. Použitie navrhnutej metódy má dať odpoveď na otázku: Aká je potrebná bitová rýchlosť, aby kvalita video – signálov degradovaného kódovaním bola dostatočná, aby bola slovenská prstová abeceda pre nepočujúcich zrozumiteľná.

1. Úvod

Rozvíjajúce sa technológie, náročnejšie techniky spracovania, či samotné filmové spoločnosti a televízie zdvíhajú štandard v kvalite obrazu i zvuku. Technicky kvalitné video však predstavuje aj nezanedbateľný dátový objem, a ten je potrebné preniesť a zaplatiť. A tak často pri umiestňovaní videa na internet ideme až do čo najmenšej vizuálne „prijateľnej“ kvality.

Z výsledkov subjektívnych hodnotení vyplýva, že neprirodzený obraz, tj. so sýtymi farbami, sa páči viac. A tiež, že pri video ukážke s kvalitným zvukom môžme poľaviť do určitej miery na kvalite obrazu, keďže zvuk znižuje schopnosť používateľa rozlíšiť znehodnotenia. Nepočujúcich však kvalitný zvuk neovplyvní. V prvom rade je pre nich dôležité, či je video ukážka (video konferencia) zrozumiteľná, a nie či je pekná, kvalitná.

Hlavný rozdiel medzi pojmami kvalita a zrozumiteľnosť je v tom, že pod pojmom kvalita rozumieme „ako“ divák vníma video signál (ako vyzerá spracovaný signál). Pod pojmom zrozumiteľnosť „čo“ divák vidí (či to čo vidí, má aj informačný zmysel). Zrozumiteľnosť predstavuje len jeden z aspektov kvality, veľmi kvalitný video signál je s veľkou pravdepodobnosťou zrozumiteľný. Opačne to samozrejme môže, ale nemusí platiť. Naopak nízka zrozumiteľnosť je predzvesťou nízkej kvality. V akustike sa za prah zrozumiteľnosti považuje hladina, kedy počujeme, ale nerozumieme [1].

2. Posunkový jazyk a prstová abeceda

Posunkový jazyk je primárny komunikačný prostriedok nepočujúcich. Ide o vizuálno – priestorový jazyk s vlastnou gramatikou a posunkovou zásobou. Má vizuálno – motorickú modalitu a je nezávislý od hovoreného jazyka, ale nie je medzinárodný. Využíva trojdimenzionálny priestor, tzv. posunkový priestor na komunikáciu, ktorý je vymedzený horizontálne i vertikálne. V posunkových jazykoch máme dva nosiče významu:

  • manuálne = tvar, pohyb a pozícia rúk
  • nemanuálne = výraz tváre, pohľad, hlava, horná časť tela, pohyb úst.

Základným prvkom je posunok. Je určený konfiguráciou (tvarom) ruky, umiestnením ruky v posunkovom priestore, orientáciou dlane a prstov a samotným pohybom ruky. Naučiť sa posunky z kníh a statických obrázkov je náročné. I jemný rozdiel v pohybe i umiestnení ruky môže zmeniť význam. Preto je potrebná osobná ukážka, či zrozumiteľná video ukážka, alebo animácia. V [5] bola navrhnutá metóda na hodnotenie zrozumiteľnosti posunkového jazyka, kde autori použili metódu založenú na ACR subjektívnom hodnotení aj na hodnotenie objektívne, pretože posunkový jazyk nemá presný prepis do slovenského jazyka.

Prstová abeceda nebola vytvorená prirodzene a spontánne nepočujúcimi, ale prebraná z kláštorov. Ide o systém konfigurácií prstov rúk a pohybov, ktoré reprezentujú abecedné znaky. Počet znakov je rôzny a súvisí s počtom hlások daného jazyka. Používa sa pre potreby spresnenia niektorých slov, alebo pri neznámych slovách, názvoch obcí a miest, pri geografických názvoch, pri menách a priezviskách a pri slovách, na ktoré osoba nepozná posunok. Výhodou prstovej abecedy je, že jej osvojenie nie je náročné ani zdĺhavé, pomáha vyjadrovať slová v správnej gramatickej podobe, a tým umožňuje získat bohatšiu slovnú zásobu. Vo svete sú rozšírené a bežne používané dva systémy prstovej abecedy: jednoručná a dvojručná [2].


Obr. 1. Príklad dvojručnej prstovej abecedy.


Obr. 2. Príklad jednoručnej prstovej abecedy.

Jednoručnú prstovú abecedu (daktyl) sa učia deti v školách pre žiakov so sluchovým postihnutím. Vo svete je viac rozšírená. V rámci medzinárodných stretnutí a organizácií sa používa len jednoručná prstová abeceda schválená Svetovou federáciou nepočujúcich. Dvojručnú prstovú abecedu používajú skôr starší nepočujúci, pretože je pomalšia, tým pádom je ľahšie jej vnímanie, je zreteľná a viac zrozumiteľná. Napriek tomu, že je pomalšia, sa používa pri prednáškach a seminároch pre jej lepšiu zrozumiteľnosť a viditeľnosť [3].

3. Zrozumiteľnosť (poznateľnosť) – logatómova

V akustike sa zrozumiteľnosť (poznateľnosť) reči definuje percentom správne prijatých prvkov alebo častí reči „a“ vzhľadom na ich celkový vysielaný počet „b“ :

Z=\frac{a}{b}.100\% (1)

Rozoznávame hláskovú, logatómová, slovnú a vetnú zrozumiteľnosť. Logatóm je slovo bez významu, pospájané z písmen abecedy tak, aby z fonetického hľadiska zodpovedalo danému jazyku, ale nebolo ani časťami bežne používaných slov. Pojem poznateľnosť sa používa pre rozoznávanie hlások (foném), keďže tu možno buď rozoznať alebo nerozoznať fonémy, no nemožno im rozumieť [4].

Pri videách môžme skúmať zrozumiteľnosť podobne. Vetnú a slovnú zrozumiteľnosť pomocou posunkov. Zatiaľ čo logatómovú a hlaskovú poznateľnosť pomocou znakov prstovej abecedy. Znak prstovej abecedy predstavuje hlásku v logatóme, čím vytvoríme akési „znakové logatómy“ pre nepočujúcich.

4. Subjektívne a objektívne metódy hodnotenia kvality a zrozumiteľnosti

Subjektívne hodnotenia sú založené na porovnávaní pôvodného a spracovaného video signálu skupinou divákov, ktorí hodnotia kvalitu a zrozumiteľnosť signálu podľa preddefinovanej stupnice na základe svojich subjektívnych pocitov.

Objektívne sa zrozumiteľnosť meria štatistickými metódami. V najjednoduchších prípadoch sa percentuálne vyjadruje počet správne rozpoznaných prvkov. Pri vetnej zrozumiteľnosti je za správnu vetu (odpoveď) považovaná významovo a zmyslovo správna veta. V logatómovej sa vyhodnocuje percento správne zachytených spoluhlások a samohlások zo všetkých hlások obsiahnutých vo vyslaných logatómoch. Z toho jasne vyplýva, že logatómová, a teda aj hlásková poznateľnosť je výrazne horšia ako vetná, či slovná, kde si vieme doplniť (pochopiť) chýbajúcu časť z kontextu [1].

5. Navrhnutá metóda

Táto práca ukazuje novú objektívnu metódu testovania prstovej zrozumiteľnosti s použitím subjektívnej metódy ACR, upravenej pre hodnotenie kvality nepočujúcej konferencie a použitím hláskovej (logatomovej) zrozumiteľnosti vyhodnotenej v percentách podľa vzťahu (1). Pri týchto metódach sú testovacie sekvencie zobrazované jedna po druhej, každá celkovo iba jeden raz. Táto metodika je založená na dvoch kritériách. A to zrozumiteľnosť posunkovania podľa premenlivej kapacity kanála azároveň podľa priestorového rozlíšenia videa. Cieľom má byť zistenie, pri akej degradácií obrazu je video sekvencia naposunkovaných znakov ešte zrozumiteľná. Respektíve aké rozlíšenie obrazu je ešte vhodné pre druhú stranu, aby posunkovanie bolo zrozumiteľné. A to subjektívne, aj percentuálne.

6. Experiment so zrozumiteľnosťou prstovej abecedy

Na základe tejto metodiky sme urobili nasledujúci experiment. Pre nepočujúcich sme vytvorili takzvané „znakové logatomy“, t.j. hlásku v logatome predstavoval znak zo slovenskej jednoručnej a dvojručnej prstovej abecedy. Bolo vytvorených celkovo 8 videí. Pre tento experiment bolo použité video obsahujúce týchto 5 logatomov: FKLBMN _ PBDKO _BADBA _ MKLBD _ DMFEB.

Pri experimente sme využili video – ukážku kódovanú v H.264 s rôznou bitovou rýchlosťou a v 3 rôznych rozlíšeniach. Celkovo 15 vytvorených ukážok (s rovnakými logatomami) bolo testovaných na 10 respondentoch vo veku 21 až 33 rokov, ktorí sledovali vždy tú istú ukážku, avšak vždy v inom rozlíšení a pri inej kapacite kanála, pričom o tom nevedeli. Keďže išlo o skupinu skúsených dospelých nepočujúcich, pri experimente stíhali „prečítané“ logatomy zapísať.

Na záver subjektívne hodnotili svoj osobný dojem zo zrozumiteľnosti predloženej ukážky podľa Tab.1, keďže video ukážka môže u respondenta vyvolať rôzne pocity, a tým ovplyvniť testovanie… Následne bolo vyhodnotené, či išlo o správne alebo nesprávne určené znaky. Výsledky z experimentu sú ukázané v Tab. 2. a znázornené graficky na Obr. 4.


Obr.3. Obrázok prevzatý z experimentu: prvý je pôvodný, ďalšie sú kódované v H.264 parametrami QP40 a QP45.

Tab.1. Hodnotiaca stupnica pre subjektívne hodnotenie.

1 Úplne zrozumiteľne
2 Čiastočne zrozumiteľné, ale pochopená podstata
3 Čiastočne zrozumiteľné, ale nepochopená podstata
4 Nezrozumiteľne

Tab.2. Výsledky experimentu.

Resolution QP 30 35 40 45
160×90 Objective evaluation [%] 97,3 88,5 80,8 63,8
Subjective evaluation 2 2,5 3 3,5
Bitrate [kbit/s] 18,9 11,2 7,1 5,9
320×180 Objective evaluation [%] 100 93,8 87,5 70
Subjective evaluation 1 1,5 2 2,5
Bitrate [kbit/s] 52,7 26,5 17,8 12,5
640×360 Objective evaluation [%] 100 100 100 100
Subjective evaluation 1 1 1 1,5
Bitrate [kbit/s] 151,3 66,4 42,1 31.2


Obr.4. Grafická závislosť Objective evaluation od QP.

Z experimentu vyplýva že je veľmi dôležité, aké je priestorové rozlíšenie videa a nie je úplne zrejmý vzťah medzi zrozumiteľnosťou a bitovou rýchlosťou.

7. Záver

V príspevku bola navrhnuta metodika vhodná pre hodnotenie kvality videa obsahujúceho posunkový jazyk. Bola vyskúšaná pre dvojručnú prstovú abecedu. V ďalšej práci je potrebné realizovať viac meraní na respondentoch viacerých vekových skupín a na videách s rôznou rýchlosťou posunkovania. Dôležité bude sledovať aj vzťah medzi zrozumiteľnosťou a vybranými objektívnymi kritériami, ktoré sa používajú na hodnotenie kvality bežného videa (odstup signál-šum, stredná kvadratická chyba…)

Poďakovanie

Realizácia tohoto výskumu bola financovaná z projektu KEGA 119-005TVU-4/2010.

Literatúra

  1. Granát, M. Objektívni metódy pro hodnocení kvality audio signálů, Vysoké učení technické v Brně. Brno, 2009.
  2. Tarsciová, D., Pedagogika sluchovo postihnutých, MABAG spol. s.r.o., Bratislava, 2008. ISBN 978-80- 89113-52-1
  3. Hefty, M., Prstová abeceda. Organizácia Myslím – rozvoj myslenia nielen pre sluchovo postihnutých, 2009, www.zzz.sk.
  4. Makáň, F., Elektroakustika. Vydavateľstvo STU Bratislava, 1995.
  5. Polec, J., Ondrušová, S., Mordelová, A., Filanová, J., New Objective Method of Evaluation Cued Speech Recognition in Videoconferences. In: Proceeding Redžúr, 2010: 4th International Workshop on Speech and Signal Processing. Bratislava, Slovak Republic, May, 14, 2010. – Bratislava : STU v Bratislave FEI, 2010, 4p., CD-Rom.

Spoluautorom článku je prof. Ing. Jaroslav Polec, Phd., Katedra telekomunikácii, Fakulta elektrotechniky a informatiky, Slovenská technická univerzita, 812 19 Bratislava, Slovenská republika


Práca bola prezentovaná na Študentskej vedeckej a odbornej činnosti (ŠVOČ 2011) v sekcii Telekomunikácie II. a získala cenu Diplom dekana, ISBN 978-80-227-3508-7

Napísať príspevok