Magyarul tudó stt (speach to text)

Fórumok

Sziasztok,

Találkozott már valaki olyan programmal, ami a címben megjelölt feladatot elfogadható hatékonysággal képes elvégezni? Viszonylag nagy mennyiségű (50+ órányi) hangfelvétel szövegesítése lenne a feladvány, jó lenne, ha nem kézzel kellene...

Az sem gond, ha nem linuxos programról van szó, bármit megoldunk, csak ne kelljen napokon át gépelni :))))

Hozzászólások

És utána ki fogja ellenőrizni?
Milyen felismerési arányra számítasz?
Régen beszélgettem egy OCR fejlesztővel.
Karakterfelismerésben a 99.5%-ra mondta, hogy kb. kezdi megérni.
Addig - az ellenőrzés és javítás munkaigényessége miatt - olcsóbb újragépelni, szerinte.

Nálunk a belsős konferenciákon a plenáris előadásokon van angol stt.
Ha jól látom, operátor felügyeli és sokat kell javítani, pedig sok spéci szóra előre van tanítva, látszólag.

Szerintem keress valakit, aki legépeli.
A végére gyorsabb és olcsóbb lesz.
(Rögtönzött piackutatás szerint kb. 0,25Ft/leütés.)

Üdv,
Marci

Ami az android telokon van, az egész jól működik. Nem tudom milyen szolgáltatás van mögötte, de érdemes lenne megpróbálni.

A Google saját hangalapú szöveg bevitelére gondolsz? Mert az szerintem magyar nyelven erős kihívásokkal küzködik még mindig. Ami szinte hibátlan, az is Swype Dragon motorja. Ez utóbbiból igen csak jó lenne egy pc.-és megvalósítás.
--------------------------

Csak a viták elkerülése végett. Ha nem használok ékezetet, mobiltelefonról írok.

Próbálj neki folyamatosan szövegelni. Használ szlengeti, vagy éppen káromkodj. Ráadásul utólag kell kitenni az írásjeleket meg átírni a mondat eleji kezdő karaktert nagybetűsre. A Swype Dragonnál jelezheted neki beszédbe.
--------------------------

Csak a viták elkerülése végett. Ha nem használok ékezetet, mobiltelefonról írok.

Nézd, én nem akarlak győzködni. Próbáld ki. Swype alól én nem rövidebb leveleket, hanem komplett, hosszú kommenteket diktálok be. Ha mondod neki, hogy nagybetű, azzal kezdi a mondatot. Ha a végén kimondod az írásjelet, kiteszi. Ha benyögöd neki egy emoji karaktereit, megismeri. Eleinte kissé béna, de fokozatosan tanítható. A google cucca ehhez képest fapados.

--------------------------

Csak a viták elkerülése végett. Ha nem használok ékezetet, mobiltelefonról írok.

A Google cucca érdekes.
A Samsung telefonjamon csapnivaló. A Hp tabletemen pedig szinte hibátlan.
- - - - - - - - - - - -
A buszállomás az a hely, ahol a buszok állnak, a taxiállomás az a hely ahol a taxik állnak, az íróasztalomon viszont van egy munkaállomás....
300hsz feletti topicot nem olvasok.

http://www.nuance.com/dragon/index.htm
– gondolom ez az, legalábbis a logója nagyon hasonló :-)
Volt vele szerencsém (angolul), nekem nem jött be különösebben.

int getRandomNumber() { return 4; }  // ← aláírás
//szabályos kockadobással választva. garantáltan véletlenszerű.  xkcd

1x belefutottam egy DragonDictation nevű techdemo-ba, android/iOS platformon. Jól tudott magyarul (árvíztűrő stb is ment neki). Pár éve volt. azóta nemtom. Azaz, nuance lett belőle, pár posttal fentebb.