Beszédfelismerő megoldás

Fórumok

Munkatársnőm kért segítséget a következő témában: egy számítógéphez nem értő személy szeretne könyvet írni. Elsőre arra gondolt, hogy diktálná a szöveget. Az jutott eszembe, hogy van olyan Linux disztribúció, amit látássérültek tudnak használni. Nincs ezekkel tapasztalatom.
Mit ajánlanátok?
A munkámból adódóan kerültem már kapcsolatba beszédfelismerő megoldással (egészségügy), de ezek elég drága licenszelésűek és nem tökéletesek.
A másik ötlet az volt, hogy leírja és azt felismerteti. Ezzel kapcsolatban attól tartok, hogy a kézírás elég esélytelen. Ha legépeli, azzal megbirkózik egy OCR szoftver, de ahhoz meg scannelni kell...
Bármilyen tanácsot szívesen fogadok.

Köszönettel:
Dw.

Hozzászólások

Chromehoz van olyan kiegészítő/weboldal amivel lehet a Googlenak diktálni (bár lehet ők hamarabb kiadják a könyvet akkor ;))
Az MS-nek is biztos van, csak nem tud magyarul.
Olyat ami offline és magyarul is tud én linuxra nem tudok. :)

Az illető tanulja meg a számítógép és a szövegszerkesztő kezelését a szükséges minimális szinten, minden egyéb megoldáshoz képest ez a legkönnyebb út szerintem.

Üdv,
Marci

+1

Nem is értem, fentebb alternatív ötletként szerepelt, hogy leírja (gondolom írógéppel), mert azt az ocr felismerné.

Ha már írógépen tudna írni, miért nem egyszerűbb egy számítógépet elé rakni ami fel van készítve arra hogy minimális ismeretekkel írógépként működjön?

Pl egy minimál linux, ami elindulása után azonnal egy teljes képernyős "distraction free" szövegszerkesztőt indít, amin semmi más opció nincs, mint gépelni, menteni, és kilépni. Kilépést követően pedig leállna a gép.

Az két dolog amit tudnia kell az írónak: Várni amíg bekapcsol és leáll a gép, és kezelni a számítógépes billentyűzetet (ha írógépeshez szokott volna). Nem hinném hogy nagy kunszt sem ez, sem a cél linux összeállítása.

Egyszer már írtam ehhez kommentet, de nem találom. A lényeg, hogy szerintem is gépelje be számítógépen. A gépelés amúgy is egy kreatív szellemi folyamat, miközben gépel és halad a mondattal, jöhetnek még gondolatok, jobb megfogalmazási ötletek, ezek elvesznek ha csak diktál, vagy kész szöveget gépeltet le. Plusz így nem kell gépírásért sem fizetnie.

Akármilyen OS jó erre, kitenni egy ikont az asztalra, ami indít egy teljes képernyős plain textes szövegszerkesztőt, aztán abba gépelheti is a művet és mentheti. Esetleg meg lehet fűszerezni, hogy indításkor mindig azt a dokumentumot töltse vissza sessionbe, és megnyitás nélkül onnan lehet folytatni, ahol abbamaradt a munka, és egy kattintással lehet menteni is.

Ezert nem fejlodik a Cortana ugy, ahogy kellene? #troll

Egyebkent szerintem ez a leggyokerebb hozzaallas, amit csak lattam. Az, hogy a jelenleg temaban levo illetonek "csak" a hozzaertes hianya a baja, az meg nem jelenti azt, hogy amit ker, ne lenne valid. Egy csonka kezunek peldaul megvaltas lenne, ha nagyobb szoveget is be tudna diktalni a Word-nek.
--
Blog | @hron84
Üzemeltető macik

diktafonba felmondja a szoveget es felfogad egy gepironot (termeszetesen adatrogzitore rogziti, nem papirra).

translate.google.com-ba bemondja, majd kivágja oldalanként. :)

iphone nekunk nagyon jol mukodott a magyarral ilyen celra, de chrome alol megnyitva a google docs is siman tudja a magyar diktalast, szerintem hasznalhato minosegben.

mgb

Javítani kézzel kell majd benne. Munkás. Lányom a telefonján képregényeket feliratoz diktálással, de tapicskolnia kell sokat javításkor.

1. Vesz egy Mac-et, letölti a Pages-t, és lediktálja a könyvet
2. Profit

Alapbol igen, de egy kis kiegeszites ehhez:

https://support.apple.com/kb/PH21849?locale=hu_HU

"A Továbbfejlesztett diktálás első bekapcsolásakor, vagy amikor a Továbbfejlesztett diktáláshoz nyelveket add hozzá, az OS X a diktálás offline működését lehetővé tévő további szoftvert tölt le. A tartalom letöltéséhez szükséges szabad lemezterület a nyelvtől függően változik."

Többen is ajánlottak beszédfelismerő szoftvert. Hosszabb, magyar nyelvű szöveg diktálásával van valakinek tapasztalata velük? A nyitó poszt miatt, itt most egy átlagos könyvnek megfelelő mennyiségű szövegre gondolok.

Valamikor régen, amikor megjelentek az OCR programok, akkor olvastam, hogy 5%-os hibaarány felett értelmetlen a használatuk. Állítólag egy jó gépíró hamarabb begépeli a szöveget, mint amennyi ideig a felismert szöveg ellenőrzésére, és javítása tart, ha a hibaarány nagyobb 5%-nál.

Szerintem ez nagyjából a beszédfelismerésre is vonatkozhat. Mert ellenőrizni mindenképpen kell a szöveget. Pl. nem mindegy, hogy esetleg elmarad valahol egy-két vessző. Vagy megy/meggy, örül/őrül,… Az ilyen jellegű hibákat többnyire a helyesírásellenőrző sem tudja javítani.

A konyvet lektoralni, korrekturazni mindenkeppen kell majd, de azt mar vegezheti egy, a szamitogephez erto rokon is. Maga az "iras", az alkotas folyamata azonban ettol fuggetlenul mehet hang alapon.

Ami itt elony lehet, hogy a diktafonrol valo atirashoz kell egy specialis skill (gyorsgepiras), mig a korrekturazashoz elegseges a magyar nyelv anyanyelvi szintu ismerete (bar itthon neha az is kihivas egyeseknek...), meg egy ECDL bizonyitvany.
--
Blog | @hron84
Üzemeltető macik

Nem akarom azt mondani, hogy a "nagy" kiadók által megjelent művek helyesírási hibákkal és elütésekkel vannak teli, a szerkesztői belebarmolásokról már meg sem emlékeznék.

Én már annak is örülnék, ha a korrektúrázók legalább a magyar nyelv anyanyelvi szintű ismeretével rendelkeznének - de sajnos nem teszik. Igen, lehet, hogy ez egy szakma (sőt, biztosan az), de ahogy elnézem, vagy mélyen alulfizetik őket és szarnak az egészre, vagy mind "léha kontár".
--
Blog | @hron84
Üzemeltető macik

Van. Semmi jóra ne számíts.

A magyar nyelv felismerése nagyon nehéz feladat és senkinek sem sikerült tökéletes megoldást létrehoznia ami valódi körülmények között elégséges lenne.

Egy Kossuth rádió felismerése évekkel ezelőtt is 99%-os pontossággal sikerült. Egy diktafonnal felvett max 60% volt.

Vagy leírja vagy felvesz valakit akit tud gépelni neki diktafon alapján.

"A magyar nyelv felismerése nagyon nehéz feladat "

Hmm...
https://youtu.be/mzsPNVzuIoI

Tudott gépelni is, megcsináltam azt is, hogy hotkey helyett hotword-re figyelt fel. Fejleszteni nem érdemes. A teljes gép vezérlését meg lehetne oldani, nem csak a gépelést.

Szerinted mit használok? Wi... neeem! Na, na, na? Hát blackPanther OS v17 beta-t * blackpantheros.eu

Androidon a Swype billentyűzet Dragon szövegfelismerőjét használom. Gyakorlatilag némi tanítás után 98 százalékosan működik. Nagyon hosszú szövegeket is diktáltam be ezen keresztül, ha egyedül vagyok, akkor már csak ezt használom telefonon. Külön le lehet zárni a mondatot a mondatvégi írásjel bemondásával, de a mondaton belül is értelmezi a "vessző" szót, pl. hogy előtt. Szóval van létező, nagy hatásfokú alternatíva, ami megbirkózik a magyar nyelvvel is. Természetesen online kapcsolat kell hozzá, nem a telefonról fut a szövegértelmezési része, de a google saját megoldása sem offline, viszont fényévekkel előtte van. Kerestem őkelmét pc.-re is, de sajnos csak windows alá létezik, ráadásul fizetős.

--------------------------

Csak a viták elkerülése végett. Ha nem használok ékezetet, mobiltelefonról írok.

A program automata vagy kézi beállítással állítható, hogy off/online működjön-e.
A fejlesztést a google api változtatása után felfüggesztettük, mert a felhasználóknak vagy egyedi kulcs kellene vagy nekem kéne megvenni. Ráadásul az api miatt át is kell írni egy csomó részt, de újra jelentkezett valaki, hogy igényelné ezt a szolgáltatást. Tehát lehet, hogy újra elővesszük és, hogy mi lesz a kóddal még nem tudom, a nyílt forrású elemeket közzé fogjuk természetesen tenni, de csak a "tényszerűen állított lehetetlent" akartam megcáfolni.

Szerinted mit használok? Wi... neeem! Na, na, na? Hát blackPanther OS v17 betat-t * blackpanther.hu

Azért parancsfelismerés és tollbamondás között akad különbség...
És az sem mindegy hogy a googlenek diktálod vagy localban futó megoldást keresel.
Ezek szerint gDocs-ba mehet közvetlenül magyarul. Azért kiváncsi vagyok a hatékonyságára :) /bár minél többen használják annál jobb lesz/

https://support.google.com/docs/answer/4492226?hl=en
példa:
https://www.google.com/intl/en/chrome/demos/speech.html