2010. szeptember 30., csütörtök

Feolvasó szoftverek a számítástechnikában

Érzékszervi hiányosságban szenvedő embertársaink számára több alternatívát is kínál a számítástechnika, a kommukáció és a tanulás terén. A beszédre képtelen emberek számára egy PDA segítségével és egy felolvasó szoftver segítségével a kommunikáció lehetséges. A nem látó ember számára a felolvasó szoftver nyújthat támogatást a tanulásban, mivel a digitalizát szöveget képesek felolvasni ezek a szoftverek.
Szoftverek érzékszervi hiányosságban szenvedő emberek számára
Szerencsére számtalan olyan ingyenes és fizetős program található az interneten, ami az érzékszervi hiányosságban szenvedő emberek számára egyenlőesélyt biztosíthat a társadalmi életben. A cikkben két felolvasó szoftvert mutatok be a teljesség igénye nélkül. Az első a Multivox 4 magyar fejlesztésű program, a második pedig a SpeakBoard nevet viseli. A szoftverek használata mind a látássérültek, mind a beszédükben akadályozott felhasználók számára támogatást nyújt az információ szerzés folyamatában. De jó segédeszköz lehet a hallás után könnyebben tanuló emberek számára is. A kiskönyvtárak is jól használhatják az esélyegyenlőség növelése érdekében.
Multivox 4
A program szabad terjesztésű és ingyenesen használható. Kis erőforrás igényű akár egy 486-os gépen is futtatható, csak egy hangkártyát igényel és 32 Mb RAM-ot. Természetesen gyengébb gépeken lassabban állítja elő a beszédet. A program kizárólag eredeti formájában, valamennyi kapcsolódó fájllal együtt terjeszthető, módosítása, visszafejtése nem megengedett. Nem csak a gyengén látóknak segít a számítógépen megjelenő információk felolvasásában, de a beszélni képtelen emberek számára is biztosíthatja a kommunikáció lehetőségét. A gyorsbillentyűk alkalmazási lehetősége a gyengén látók számára könnyíti meg a program használatát. A telepítése, amiről később lesz szó, egyszerű, a hangok tisztasága elfogadható. A szoftver kezelhetőségét inkább nem én dönteném el, hiszen az felhasználónként változik. Text to speech szoftver “TTS” ami azt jelenti, hogy felolvassa a kapott szöveget. Az implementált interface-ek listáját megtaláljuk a felhasználói kézikönyvben. Szabványos Microsoft SAPI 4.0 programozási felülettel van ellátva a szövegfelolvasó program, amely a Multivox 4 szintézis rendszeren alapul és a legelterjedtebb operációs rendszereken futtatható. A szintetizált hang minden hangkártyával rendelkező PC-n egyéb kiegészítés nélkül megszólaltatható. A Multivox 4 fejlesztője a BME Távközlési és Telematikai Tanszéke, az alapkutatásokat a MTA Nyelvtudományi Intézete és a Kempelen Farkas Beszédkutató Laboratóriumban végezték.
Nézzük, hogy mit tud a program:
Beszélő óra
A “Beszélő óra” funkció azzal lep meg bennünket, hogy a számítógép, a beépített órája alapján, időközönként hangos tájékoztatást nyújt a pontos időről. Természetesen lehetőség van a dátum hangos bemondatására is és beállíthatunk egy emlékeztető időpontot is, ami bizonyos időközönként tetszőlegesen meghatározott figyelmeztető szöveget mond a felhasználónak. Mindehhez 24 felolvasó hang közül választhatjuk ki a számunkra legkedvesebbet. A program elmenti a felhasználó aktuális beállításait: az idő bemondásai közötti szünetek hosszát, az emlékeztető szövegét, a választott hangot, valamint az óra helyét és méretét. A ’Dátum’ menüpont kiválasztásával, vagy a Ctrl+D billentyűkombinációval kérhetjük az aktuális dátum bemondását a hét napjával és a pontos idővel együtt. A program az Emlékeztető beállításakor a felhasználó által meghatározott időpontban figyelmeztető szöveges üzenetet ad. Az Emlékeztető időpontját a beállítások/Emlékeztető menüpontban találhatjuk, értékét az időpont kiválasztásával, vagy a Ctrl+E gyorsbillentyű segítségével adhatjuk meg. Az emlékeztető működését be- illetve kikapcsolhatjuk a menü ’Emlékeztető be’ illetve ’Emlékeztető ki’ menüpontjaival, illetve a Ctrl+B, Ctrl+K gyorsbillentyűkkel.
Az “Idő bemondás” programban az óra a felhasználó által meghatározott időközönként, közli a pontos időt. A választható időintervallumok: 1, 5, 15, 30 illetve 60 perc. A beállítást módosíthatjuk a Beállítások menü Időköz menüpontjával, vagy a Ctrl+1, Ctrl+2, Ctrl+3, Ctrl+4, Ctrl+5 gyorsbillentyűkkel.
Hangos felolvasás
Az “Olvasó” programmal a szövegfájlok tartalmát olvastathatjuk fel soronként, kijelölt részenként, illetve egyszerre az egész szöveget is. Természetesen lehetőség van a kész szövegek szerkesztésére, utólagos átalakítására is. A hangos felolvasás funkció ugyanakkor nemcsak a már kész szövegek hangzóvá tételére teszi alkalmassá a számítógépünket. Lehetőség van ugyanis arra is, hogy a közölni kívánt szöveget aktuálisan gépeljük be a klaviatúra segítségével a számítógépbe, majd lenyomva az F1 gyorsbillentyűt a gép azt visszamondja az előzőekben általuk kiválasztott hangon. Az előbbi funkció a gyengén látóknak lehet hasznos, az utóbbi a beszédre képtelen embereken segít, lehetővé téve a szintetizált gépi hangon történő hangos beszélgetést a halló társakkal.
A szövegfájlok szerkesztéséhez, kezeléséhez a Fájl menü pontjait használhatjuk. Új szöveg létrehozásához az ’Új menü’ pontot válasszuk, ennek gyorsbillentyűje a Ctrl+N. A létező, már mentett szövegfájlt a ’Megnyitás’ menüponttal olvastathatunk be, aminek a Ctrl+O a gyorsbillentyűje. A felbukkanó dialógus ablakban az OK gomb lenyomásával tudjuk kiválasztani a kívánt fájlt. Az éppen használt szöveget a ’Mentés’ paranccsal menthetjük. Ennek gyorsbillentyűje a Ctrl+M. Menthetünk az előzővel megegyező néven, ilyenkor felülírjuk a már meglévő anyagunkat, vagy a ’Mentés másként’ paranccsal, aminek gyors billentyűje a Ctrl+S. Ebben az esetben új nevet kell adnunk a dokumentumnak, miközben az eredeti dokumentum a régi nevén változatlan formában megmarad. A szöveg szerkesztésében a Szerkesztés menün keresztül elérhető ’vágólap’ segít bennünket. Ennek funkciói: a kivágás, aminek gyorsbillentyűje a Ctrl+X, a másolás, gyorsbillentyűje Ctrl+C, a beillesztés, gyorsbillentyűje Ctrl+V, valamint a törlés, ami minden esetben a “DEL” gombbal történhet. A teljes szöveg kijelölését a Ctrl+A gyorsbillentyű segítségével tehetjük meg. Ha tévesen módosítottuk a szöveget, akkor lehetőségünk van az előző módosítás hatását a Visszavonás paranccsal semlegesíteni, és visszaállítani az előző állapotot. Ennek a parancsnak a Ctrl+Z a gyorsbillentyűje.
A szövegek felolvastatásakor választhatjuk az adott sort az F1 gyorsbillentyű segítségével, de kérhetjük a kijelölt rész felolvasását – F2 gyorsbillentyű -, sőt a teljes szöveg felolvasását is. Ebben az esetben az F3 gyorsbillentyűt kell használnunk. A felolvasást a ’Beszéd leállítása’ menüponttal vagy az ESC gyorsbillentyű lenyomásával szakíthatjuk meg. A szintetizált hangszínt a beszélő óránál leírt módon választhatjuk meg.
A szövegfelolvasó rész akkor képes felolvasni a fent említett hangokon a szöveget a nem látó ember számára, ha az txt formátumban van, illetve ha az jegyzettömbben íródott. Mivel minden szöveg konvertálható txt formátummá, így minden felolvastatható. Természetesen nemcsak a saját leveleink, írásaink, üzeneteink. Ma már számtalan digitalizált könyv található az interneten, ami szabadon letölthető és felolvastatható. Aki digitalizált könyveket szeretne letölteni, annak javaslom, induljon el a http://e-konyv.lap.hu/ vagy a http://mek.oszk.hu/ oldalról, vagy írja be a keresőbe “e-könyv” kifejezést. Ha nem txt-ben töltöttük le a könyveket, akkor azokat konvertálni kell. Ehhez számtalan program áll a rendelkezésünkre, de már az is elég a program számára a felolvasáshoz, hogy ha a szöveget a vágólapra másoljuk.
A program óriási előnye, hogy a PDA-kon (pocket pc) is fut. A beszédre nem képes felhasználó kényelmesen és diszkréten használhatja. A magyar nyelv mellett az angol nyelvet is alkalmazhatjuk, de ehhez fel kell telepíteni a kiegészítő programokat.
Lapmondó
A “Lapmondót” különböző módokon használhatjuk, aszerint, hogy milyen beállításokat alkalmazunk. Az alapműködés szerint a program csak akkor olvas, ha azt tesszük az aktuális ablakká az egérrel való rákattintással, vagy az ALT+TAB gyorsbillentyű alkalmazásával. Ezt módosíthatjuk a Beállítások menü ’Olvasás másoláskor’ pontjának bekapcsolásával, aminek gyorsbillentyűje Ctrl+M. Ekkor szövegnek a vágóasztalra való helyezésekor másolással CTRL+C gyorsbillentyűvel, kivágással CTRL+X gyorsbillentyűvel azonnal megszólaltatható a szövegfelolvasó. Megtehetjük, hogy a másolt szöveget nem csupán felolvassuk, hanem tovább használjuk egy szöveg szerkesztése során, ehhez azonban ki kell kapcsolnunk a Beállítások között a ’ vágóasztal ürítése olvasáskor’ menüpontot, hogy a felolvasás után ne törlődjön rögtön a vágóasztal tartalma. A program menti a felhasználó aktuális beállításait. Az ’Állj’ paranccsal vagy az ESC gyorsbillentyűvel természetesen itt is bármikor leállíthatjuk a szöveg felolvasását. Tehát képes a vágóasztalra helyezett szöveget felolvasni anélkül, hogy beillesztenénk bárhova, így nem csak a szövegszerkesztő, de a táblázatkezelő vagy akár a böngésző tartalmát is kijelölhetjük és felolvastathatjuk a programmal. A CTRL+M gyorsbillentyű hatására azonnal felolvassa, amit a vágólapra helyeztünk, míg a CTRL+V gyorsbillentyűvel a felolvasás után üríti a vágólapot. A felolvasás leállítása az ESC gyorsbillentyűvel történik itt is.
Néhány fontos ismeret:
setup.exe - automatikusan telepíti a beszédmotorhoz tartozó program- és adatbázis-komponenseket
atsstress.exe - a program stabilitását teszteli.
spchapi.exe - MS SAPI 4.0 vezérlési felület, amit a program indítása előtt célszerű elindítani.
msttsl.exe - angol nyelvű szövegfelolvasást teszi lehetővé.
sapi4sdk.exe - telepítő és a fejlesztési eszközöket tartalmazza.
sapi4sdksuite.exe - az angol nyelvű beszédfelismerő program.
A program tetszőleges írott ASCII szöveget értelmez, ami azt jelenti, hogy angol billentyűzeten is kimondja a magyar magánhangzókat, ha megkapja az annak megfelelő ASCII kódot. Képes dallamos, bár gépi hangzású köznapi beszéddé alakítani a kapott szöveget, sőt magyar nyelven különleges hangzások is beállíthatók az opciók használatával. Ne feledjük! A számítógép csak annyit tud, amennyit az előtte ülő felhasználó. A szoftver a nyomtatott szövegen túl képes felismerni akár az írott szöveget is, de ennek a funkciónak az alkalmazása többlépcsős folyamatot igényel. Ha saját magunk készítünk elő kimondásra szövegeket, akkor viszont számos opció áll rendelkezésünkre, hogy saját ízlésünk, kívánságunk szerint programozzuk a kiejtendő beszédet. Az opciókat a szövegben mondat szinten alkalmazhatjuk. Mondat szinten az opciót egy parancsjelző * karakter begépelésével és utána egy betűjel és egy szám megadásával állítjuk be. A szám után szóköznek kell lenni, azután kezdődhet a mondat. A mondat szintű opció csak új mondat kezdésekor alkalmazható és addig hat, amíg egy másik mondat elején át nem állítjuk.
Egyedi beállítások
A “Szótárkezelő funkció” segítségével a felhasználó a gyakran előforduló speciális karaktersorozatokhoz egyedi, a megszokottól eltérő kiejtést is rendelhet. Így akár az idegen nyelvű és hangzású szavakat is ki tudjuk mondatni magyaros kiejtéssel. A Szó ablakba – gyorsbillentyűje az ALT+S – kell beírni a különleges kiejtést igénylő karaktersorozatot (pl. Wien). A Kiejtés ablakban – gyorsbillentyűje ALT+E – pedig a hallani kívánt alakot kell megadni (pl. bécs). A Módosítás gombra – gyorsbillentyű: ALT+M – kattintva jelezhetjük, hogy a beírt adatokat elfogadjuk. A Bemondás gombot aktivizálva – gyorsbillentyű: ALT+B – pedig meghallgathatjuk az eredményt. Ha nem tartjuk megfelelőnek, a Törlés gomb – gyorsbillentyű: ALT+T – segítségével visszavonhatjuk a módosítást utólag is. Ekkor a Szó ablakba beírt karaktersorozathoz tartozó definíciót automatikusan jeleníti meg a program a Kiejtés ablakban. A Módosítás parancs kiadása után a változtatás a felolvasó rendszerben azonnal érvényre kerül. Pl. a fenti példa végrehajtása után az Olvasó alkalmazásban a “Newyorkban jártam” karaktersorozatot megszólaltatva a “nyújorkban jártam” hangzás valósul meg. A programból a Kilépés gomb – gyorsbillentyű: ALT+K – segítségével léphetünk ki.
Az “MV4.CFG” állományban történhet meg az alapértelmezések átállítása és a mondatszintű opciók is átállíthatók, de ezek átállítását csak profiknak ajánlom. Ha kísérletezünk az mv4.cfg állománnyal, előtte mentsük el az alapbeállításokat, így később visszaállíthatjuk az alapkonfigurációt. A hangkarakterek változtatása illetve megadása *v x x=0-31, *v0-tól *v23-ig nevekkel ellátva. A rendszerben három férfi és három női hang, valamint azok különböző megszólalási formái előre el vannak készítve és fantázianévvel ellátva. Ezek a *v0 – *v23 hangok. Ezeken nem célszerű változtatni.
A konfigurációs fájl paramétereinek jelentése a következő:
AMPLITUDE hangerősség (0-tól 14-ig)
0= nincs hang
3= nagyon halk
14= a leghangosabb
WHISPER suttogás
0= normál hang
1= suttogás
PITCH az alapfrekvencia Hz-ben (40-500)
ARTICULATION a tagolás mértéke
0= folyamatos beszéd
1–4= egyre fokozottabb tagolás
5= nagyon tagolt beszéd
INTONATION intonációs fokozatok
0= monoton hangzás
1= intonáció bekapcsolva
Felhasználói kézikönyv 12. oldal
TIMING=0 beszédtempó
0= a hangok a legrövidebbek
1= normál
2= a hangok hosszabbak
3= a hangok a leghosszabbak
Telepítés
A program telepítése nagyon egyszerű, csupán elindítjuk a setup.exe állományt és az végigvezet bennünket a telepítés során. Miután bejelöltük a licence elfogadását és megadtuk az elhelyezési hely mappájának betűjelét, sor is kerül a telepítésre. A szoftver automatikusan felépíti a program futásához szükséges platformot. Természetesen ennek előfeltétele, hogy a hangkártyának már telepítve kell lennie. A program a http://alpha.tmit.bme.hu/pub/multivox4/ weboldalról tölthető le.
SpeakBoard
A második felolvasó szoftver a „SpeakBoard”, amivel megismerkedhetünk. Szép és igényes magyarsággal képes visszaadni a vágólapra másolt szöveget. Tudtommal sajnos nem ingyenes. Ez egy olyan felolvasó program, aminek segítségével magyar nyelven, természetes hangzású női vagy férfi hangon tudjuk felolvastatni Word dokumentumainkat, e-mailjeinket, az Interneten található weblapokat, pdf dokumentumokat, szöveges állományokat és minden egyéb képernyőn megjelenő szöveget.
Telepítési követelmények
Minimális hardver igény: Pentium II. 300 MHz, 64 MByte memória, 100 MByte szabad hely a merevlemezen, Windows kompatibilis hangkártya.
Minimális szoftver igény: Windows 98, Internet Explorer 4.0. de fut Xp-n is.
Használati jellemzők
A gyengénlátók is eredményesen használhatják a SpeakBoard programot a képernyőn megjelenő apró feliratok felolvasására, vagy akár hosszabb dokumentumok meghallgatására is úgy, hogy közben a képernyőn követhetik az elhangzottakat. A felolvasás közben megjelenő szövegek tetszőlegesen nagyok lehetnek, vagy akár teljesen ki is kapcsolhatók. A betűméretek növelhetők. A program képes felolvasni a Word dokumentumokat, e-maileket. Bármely szöveges fájlt (.txt) kijelölés nélkül is felolvastathatunk. A szöveges állományokat át lehet alakítani és el lehet menteni wav formátumba. Képes a vágólap tartalmát is és a weblap szövegeket is felolvasni. A felolvasó program pontosan azt olvassa fel, ami le van írva. Éppen ezért használható szövegek hangos helyesírás ellenőrzésére is, hiszen az elütéseket, elírásokat sokszor jobban észre lehet venni a szöveg meghallgatásakor, mint többszöri átolvasással. A szoftver TTS algoritmusa figyelemreméltó minőséggel ajándékozza meg a felhasználót. A beszédszintetizátor egészen élethű és emberi. Kellemes orgánummal rendelkezik, és még a hangsúlyokat is jó helyre teszi. A teljes verzióban több hangszín közül választhatunk. A szoftver használata nagyon egyszerű, telepítés után máris betelepül a tálcára, ettől fogva bármi, amit a vágólapra teszünk (azaz kijelölünk vagy másolunk CTRL+C) azt a számítógép azonnal felolvassa. Mivel a program a vágólapon keresztül működik, szinte mindent fel tud olvasni. Van hangrögzítő funkció is: ebben az esetben a vágólapra másolt szöveg hangos változatát el is menthetjük WAV vagy MP3 formátumban. E funkció segítségével a könyvtárak könnyedén előállíthatnak saját hangoskönyvtárat is, hiszen elég, ha megszerezzük a hőn áhított művet szöveges formátumban, majd a SpeakBoard segítségével pillanatok alatt hangoskönyvet varázsolhatunk belőle.
Mivel a hosszabb szövegeket jóval kényelmesebb és „szemkímélőbb” hallgatni, mint a képernyőről olvasni, ezért nemcsak a gyengén látóknak hasznos ez a szoftver, hanem bárki felhasználója lehet. Mindent összevetve, jelenleg a SpeakBoard az egyik legjobb magyar nyelvű TTS szoftver, mindenképpen érdemes kipróbálni. Ezekkel a programokkal a hallás után jobban tanuló, a túlzott monitor használattól könnyen elfáradó vagy látássérült emberek is könnyedén hozzájuthatnak azokhoz az elektronikus információkhoz, melyek ma már mindenki számára oly természetesek.

Non schole, sed vitae discimus !

3 megjegyzés:

  1. Szia

    Nekem nem sikerült feltelepíteni egyik programot sem. Mi lehet az oka?

    VálaszTörlés
  2. Nekem sikerült a multixoy4-et de az NVDA fizetős azért nem megy

    VálaszTörlés
  3. Szerintem tök jó csak döglök az ágyon pijalok a gép meg felolvassa amit beadtam neki
    ez az élet kiscsákó

    VálaszTörlés