Elektronikus könyvtár sérült embereknek
A „Vakbarát” Magyar Elektronikus Könyvtár és a VilágHalló online felolvasó rendszer a vakok és hallássérültek előtt nyitja ki az olvasás lehetőségét – tudta meg az OBJEKTÍV Hírügynökség az OM Sajtóirodájától.
A MEK Egyesület, átgondolva látássérült olvasóinak helyzetét, az elektronikus könyvtárhoz vakbarát belépési oldalt hozott létre. A dokumentumok letöltéséhez egyszerű text formátumot, az erre alkalmas dokumentumokhoz pedig online felolvasási lehetőséget biztosít. Mind az online felolvasás mind a text formátum kiinduló pontja az XML, a mára már nemzetközileg elfogadott szövegábrázolási szabvány. Tekintve, hogy ezek előállítása nagy munka, igyekeztünk minél szabványosabb formában, a Text Encoding Initiative (TEI) alapján elkészíteni, hogy később már gépi konverzióval kinyerhető legyen az e-book vagy más, később igényként felmerülő egyéb formátum.
A hálózati technológiák fejlődése a vak és csökkentlátó felhasználók számára kedvezőtlen irányba fordult a grafikus felületek térhódításával. Az eredetileg karakteres programokra kidolgozott felolvasó (text to speech) programok segítségével a bonyolult képeket tartalmazó oldalakon már nem lehet eligazodni. Az egér, mint fő navigálási eszköz, a vakok számára alkalmatlan. A fejlődés irányát követve a MEK is áttért összetettebb szolgáltatást nyújtó újabb technológiákra, de a látássérült olvasók nagy számára való tekintettel, egyidejűleg vakos használatra optimalizált belépési pontot is kíván nyújtani. Ezt a célt szolgálja a http://vmek.oszk.hu internet címen nyíló oldal, az online felolvasás lehetősége, valamint a text formátumban is feltöltött szövegek. Az így kialakított oldal egyben a gyengébb kapcsolattal rendelkező olvasók számára is előnyös a grafikus elemek kis száma miatt.
A tervezés során derült ki, hogy a fejlesztésbe nem érdemes ma már belefogni az XML technológia alkalmazása nélkül. A logikai jelölőkkel ellátott szövegből ugyanis a letöltésre és felolvasásra szánt szövegek éppúgy előállíthatók konverzióval, mint a látók számára is alkalmas HTML oldalak, PDF fájlok, valamint a jövőben várható (esetleg váratlan) igények, mint pl. az e-book. Továbbá felhasználható a szöveg differenciált keresésre, újabb szöveggyűjtemény összeállítására, sőt, ha szükségessé válik, akár braille-ben is kinyomtatható.
A sokoldalú későbbi felhasználás egységes, lehetőleg nemzetközi szabványon alapuló szerkezeti meghatározottságot igényel. Erre a célra a TEI (Text Encoding Initiative) ajánlásai alapján készíttetett a MEK minden dokumentumtípusra kiterjedő DTD-t (documentum type definition), amely a későbbiekben az OSZK egyéb digitalizálási projektjeiben is felhasználható.
A DTD-t az Empolis Magyarország készítette, az IHM-ITEM pályázat keretében.
A VilágHalló online felolvasó rendszer
A VILÁGHALLÓ egy nyílt forráskódú internetes online felolvasó rendszer, mely az interneten lévő szövegeket mesterségesen generált emberi beszéd formájában teszi hallgathatóvá. (Olvasásszakértők szerint ez a fajta felolvasás – éppen mert személytelen, érzelemmentes – jobban hasonlít az olvasásra, mintha színész tolmácsolná a szöveget, mivel az olvasó saját maga értelmezheti a művet.)
Jelenleg még kissé mesterkélt a felolvasó hang, de fejlesztőinek kitűzött célja, hogy a géphang minősége megközelítse, sőt elérje a természetes emberi beszédet.
A VilágHalló mind filozófiájában, mind információtechnológiai megoldásában alapvetően eltér a képernyő-felolvasó szoftverektől , melyek használata esetén a felhasználók külön-külön gondoskodnak a szoftverkomponensek beszerzéséről és folyamatos frissítéséről, a szövegek letöltéséről, a kapcsolódó szerzői jogi követelmények betartásáról, a megfelelő tároló és processzor kapacitásról stb.
Ezekkel szemben a VILÁGHALLÓ egy központilag menedzselt integrált online szolgáltatás, ami az elérhető szövegeket kombinált szöveg- és hangfolyamként juttatja el a hallgatóhoz (mint egy „szövegrádió”) egy speciális, erre a célra kifejlesztett hang-szöveg szinkronprotokoll (wow) segítségével. Ez biztosítja, hogy a szövegben navigálni, lapozni lehessen. Ez a megoldás szerzői jogi szempontból is előnyös, mert a szöveg nem jelenik meg önállóan a felhasználónál, nem töltheti le, nem mentheti el, és így mentesül sok szerzői jogi megkötéstől. Lehetőség van a kivételszó (nem úgy kell ejteni, ahogyan írva van), idegenszó, tulajdonnév kiejtésének központi kezelésére.
A szoftver-komponensek és az internetes szövegállomány változásainak követését és a rendszerbe építését a szolgáltató végzi és teszi elérhetővé a felhasználók számára. Hogy csak a fontosabbakat említsük: a beszédgeneráló motor fejlettebb verzióra cserélése (pl. több hangszín, állítható sebesség), az újabb motorok (pl. idegen nyelvű) beépítése, az elektronikus formában elérhetővé vált szövegek, szövegábrázolási standardok (pl. XML, TEI) használata, a számítógépes nyelvi elemzés új eredményeinek felhasználása.
A VILÁGHALLÓ a tárolt szövegeket a felolvasásra legalkalmasabb formátumra hozza függetlenül attól, hogy milyen formátumban érhetők el (HTML, ZIPHTML, TXT, ZIPTXT, MSWORD, RTF, XML, SGML) és a felolvasás szempontjából informatív, strukturális és nyelvi annotációkkal látja el (ilyenek pl. a mondat, bekezdés, versszak, fejezet, stb. jelölések vagy az – akár ragozott - idegenszó illetve név helyes kiejtése).
A szükséges szoftver és hardver komponensekről a felhasználónak még csak tudomást sem kell szereznie, a megfelelő CPU igényt, tárolási kapacitást és minden egyéb erőforrást a szolgáltatás biztosítja és így ezek költségei nem a felhasználót terheli. Elegendő egy vékony kliens programot letölteni és az internetre kapcsolódni, akár telefonvonalon is.
Mindehhez a VILÁGHALLÓ egy egységes közeget és a vakok által is könnyen, vizuális információk nélkül is kezelhető felhasználói felületet biztosít. Ez a felület személyre szabható, beállítható a legkedvezőbb megjelenés és a billentyűk, amikkel kezelni lehet. A felhasználói beállítások megmaradnak, míg a folytonosan fejlődő alkalmazás minden bejelentkezésnél frissül (Webstart). A felhasználói beállítások közül az egyik legfontosabb a „KÖNYVJELZŐ” funkció, mely lehetőséget biztosít arra, hogy ott folytassuk a könyvet ahol abbahagytuk. (Egy átlagos méretű könyv felolvasása 12 órát venne igénybe.)
Jelenleg a VILÁGHALLÓ a Magyar Elektronikus Könyvtár (MEK) vakbarát oldalához kapcsolódik és az új MEK szövegeit olvassa. Ehhez a Profivox beszédszintetizáló motort használja.
A ProfiVox magyar nyelvű beszédgeneráló szoftver (TTS, Text-to-Speech). Az eszköz közel 10 év fejlesztő munkájának eredménye, a BME Távközlési és Telematikai Tanszék kiemelkedő kutatói fejlesztették. Ma is folyamatosan fejlesztik, pillanatnyilag ez a legszebben beszélő magyar TTS motor. Nem ingyenes.
Minden nyelven vannak TTS (Text-to-Speech) motorok, némelyik hangját szinte nehéz megkülönböztetni az emberi hangtól, a kevésbé jókat akár ingyen is el lehet érni.
A VILÁGHALLÓ világviszonylatban is egyedülálló.
A Szabály Informatikai Bt. által elindított, és az IHM kutatásfejlesztési pályázata által támogatott program keretében a K-PRO Kft. fejlesztette.
Teszt (Béta) változata jelenleg a http://www.uhu.hu/vilaghallo oldalról tölthető le a használatához szükséges JAVA szoftverkomponensekkel együtt. A végleges verzió http://www.vilaghallo.hu oldalról fog szolgáltatni.
Hírforrás: OBJEKTÍV Hírügynökség 2004. március 4.
Gy. Mészáros Ágnes
|