Mi a transcript magyarul, leirat?
Olyan toolt keresek, ami magyar es angol nyelvű meetingeket kielégítő minőségben le tud írni. Az sem baj, ha a résztvevőket meg tudja különböztetni.
Kielégítő minőség: utána chatgpt tud belőle summary-t csinalni, amiből egy olyan ember is képbe kerül, aki nem volt jelen, tehát nincsenek emlékei a meetingről.
Feltétel: legyen helyben futtatható önálló program, ne legyen pl. egy Chrome extension, ami beépül a Google meetbe. Egyszerűen hallgatózik és leír egy text file-ba.
Ötlet?
- 628 megtekintés
Hozzászólások
A llama.cpp-s ggerganov whisper.cpp-je, illetve az ebből készített, (llamafile-on alapuló) whisperfile? Szerintem a base meg small modellek nem feltétlenül a legjobbak, de a nagyobbakkal pozitív tapasztalatom volt (OK, kevés). És elég gyenge gépeken is elmuzsikál, nem kell 80 GB VRAM.
- A hozzászóláshoz be kell jelentkezni
Nem mondanam, h ertem, amit irsz:)
Mit kell tennem ahhoz, h legyen egy transcriptem egy beszelgetesrol, ami egy szobaban zajlik?
- A hozzászóláshoz be kell jelentkezni
Ha van a meetingről felvétel, vagy a szobában folyó beszélgetést fel tudod venni bármilyen hangformátumban, akkor ezt adod oda a whisper.cpp -nek, ő csinál átiratot.
- első lépésben w16-bites wav / mp3 vagy ogg formátumot kell előállítani (ffmpeg pl.); AKARMI.mp3
- ezt oda kell adni a whisper.cpp-nek (*), és a kimenetet átirányítod AKARMI.txt -be (alapból timestamppel kapod az anyagot)
- és egy Tinidiarize nevű eszköz segítségével jelzi, hogy mikor van a beszélgetésben váltás (edig A beszélt, most váltunk B-re)
A fent említett githubos oldalán ezek mindegyikére van példa.
(*) letölthetőek különböző minőségű csak angol, vagy többnyelvű modellek, ezekkel érdemes próbálkozni.
- A hozzászóláshoz be kell jelentkezni
Köszi.
- A hozzászóláshoz be kell jelentkezni
> ami magyar es angol nyelvű meetingeket kielégítő minőségben le tud írni
az MS Teams tud ilyet, lattam mar mukodes kozben. megbeszeles kozben valos idoben irta le, eleg durva... mondjuk ott azert konnyu megkulonboztetni a resztvevoket, mert a teams latja melyik hang stream melyik usertol jon. de azt nem tudom, milyen licensz kell hozza...
on-prem:
- A hozzászóláshoz be kell jelentkezni
nem rossz ha a teams ad ilyen featuret, leirat készítés résztvevőkre bontva angolul és magyarul egyaránt alacsony szó/betű hibaráta mellett.
on-prem whisperhez egy irodai win localhost erőforrásszegény, még a base vagy a small modellel is kínlódós lesz, legalábbis egy hp i5 w11-en hasonló céllal próbálva, max kihajtott cpu-val, nagyon lassan, és magyarul nekem nem annyira volt jó a szöveg amit leírt. A large modellhez meg GPU meg viszonylag sok vram egy rtx3060/12gb már kellene, vagy M-es apple sok rammal, ilyen nem nagyon van irodai konfigokban.
- A hozzászóláshoz be kell jelentkezni
reg teszteltem, de ugy remlik a gtx1080-as kartyaval eppen ment realtime a legnagyobb model. irodai pc nyilvan keves ehhez, vagy venni kell hozza vasat vagy ott a felho...
- A hozzászóláshoz be kell jelentkezni
Van ebből kész tool, amit napi szinten tud használni az átlag user?
Tehat olyan megoldás, ami felveszi a hangot majd leírja és feltölti vhova vagy küld emailt v. ilyesmi?
- A hozzászóláshoz be kell jelentkezni
Magyarul tökéletesen használhatatlan. A leiratnak alig van köze az elhangzottakhoz, majd abból gyárt az AI összefoglalót, ez utóbbi egyébként baromi jó minőségűnek tűnik egész addig, amíg el nem olvasod a nyers leiratot és rá nem jössz, hogy shit in, shit out.
- A hozzászóláshoz be kell jelentkezni
kb egy éve még megesett, hogy angolra állított teams felületről indított magyar beszélgetés felvétele mellé angol szavakból generált szöveget. Nem lefordította, hanem telehalucinálta, mert angol nyelvként próbálta értelmezni a magyart.
- A hozzászóláshoz be kell jelentkezni
A Google Meet eleve összefoglalót ír, de asszem arra nincs lehetőség, hogy a teljes beszélgetés leiratához hozzáférj. Csavar: angolul foglalja össze a magyar meeteket is. Ha van nyelvértési gond, akkor ez lehet egy korlátozó tényező (azért nem javaslom a gépi fordítást, mert az összefoglalóban is veszhet el infó, a fordításnál is veszhet el infó, ha mindkettő van, akkor lehet, hogy NAGYON nem azt kapjátok, ami elhangzott tényleg).
- A hozzászóláshoz be kell jelentkezni
A Google meet nem ért magyarul, de javíts ki. Legalábbis magyar nyelvet nem ajanl fel.
- A hozzászóláshoz be kell jelentkezni
Szerintem csak jegyzetet nem tud magyarul prezentálni. Azért nem ajánlja fel a nyelvet. De amúgy a meetet mintha értené.
De bevallom, ezek a legtöbbször IT meetek, végtelen mennyiségű szakszóval dobálózunk, simán lehet, hogy azokból kitalálja mire gondolunk.
- A hozzászóláshoz be kell jelentkezni
Király, kipróbálom.
- A hozzászóláshoz be kell jelentkezni