Transcript tool

Fórumok

Mi a transcript magyarul, leirat?

Olyan toolt keresek, ami magyar es angol nyelvű meetingeket kielégítő minőségben le tud írni. Az sem baj, ha a résztvevőket meg tudja különböztetni.

Kielégítő minőség: utána chatgpt tud belőle summary-t csinalni, amiből egy olyan ember is képbe kerül, aki nem volt jelen, tehát nincsenek emlékei a meetingről.

 

Feltétel: legyen helyben futtatható önálló program, ne legyen pl. egy Chrome extension, ami beépül a Google meetbe. Egyszerűen hallgatózik és leír egy text file-ba.

 

Ötlet?

Hozzászólások

Ha van a meetingről felvétel, vagy a szobában folyó beszélgetést fel tudod venni bármilyen hangformátumban, akkor ezt adod oda a whisper.cpp -nek, ő csinál átiratot.

- első lépésben w16-bites wav / mp3 vagy ogg formátumot kell előállítani (ffmpeg pl.); AKARMI.mp3

- ezt oda kell adni a whisper.cpp-nek (*), és a kimenetet átirányítod AKARMI.txt -be (alapból timestamppel kapod az anyagot)

- és egy Tinidiarize nevű eszköz segítségével jelzi, hogy mikor van a beszélgetésben váltás (edig A beszélt, most váltunk B-re)

 

A fent említett githubos oldalán ezek mindegyikére van példa.

 

(*) letölthetőek különböző minőségű csak angol, vagy többnyelvű modellek, ezekkel érdemes próbálkozni.

Szerkesztve: 2025. 07. 27., v – 10:47

> ami magyar es angol nyelvű meetingeket kielégítő minőségben le tud írni

az MS Teams tud ilyet, lattam mar mukodes kozben. megbeszeles kozben valos idoben irta le, eleg durva... mondjuk ott azert konnyu megkulonboztetni a resztvevoket, mert a teams latja melyik hang stream melyik usertol jon. de azt nem tudom, milyen licensz kell hozza...

on-prem:

https://hup.hu/node/181339

nem rossz ha a teams ad ilyen featuret, leirat készítés résztvevőkre bontva angolul és magyarul egyaránt alacsony szó/betű hibaráta mellett. 

on-prem whisperhez egy irodai win localhost erőforrásszegény, még a base vagy a small modellel is kínlódós lesz, legalábbis egy hp i5 w11-en hasonló céllal próbálva, max kihajtott cpu-val, nagyon lassan, és magyarul nekem nem annyira volt jó a szöveg amit leírt. A large modellhez meg GPU meg viszonylag sok vram egy rtx3060/12gb már kellene, vagy M-es apple sok rammal, ilyen nem nagyon van irodai konfigokban. 

A Google Meet eleve összefoglalót ír, de asszem arra nincs lehetőség, hogy a teljes beszélgetés leiratához hozzáférj. Csavar: angolul foglalja össze a magyar meeteket is. Ha van nyelvértési gond, akkor ez lehet egy korlátozó tényező (azért nem javaslom a gépi fordítást, mert az összefoglalóban is veszhet el infó, a fordításnál is veszhet el infó, ha mindkettő van, akkor lehet, hogy NAGYON nem azt kapjátok, ami elhangzott tényleg).

Blog | @hron84

valahol egy üzemeltetőmaci most mérgesen toppant a lábával 

via @snq-

Szerintem csak jegyzetet nem tud magyarul prezentálni. Azért nem ajánlja fel a nyelvet. De amúgy a meetet mintha értené.

De bevallom, ezek a legtöbbször IT meetek, végtelen mennyiségű szakszóval dobálózunk, simán lehet, hogy azokból kitalálja mire gondolunk.

Blog | @hron84

valahol egy üzemeltetőmaci most mérgesen toppant a lábával 

via @snq-