A híradók szöveges verziójának kinyerése teletextből

Sziasztok,

Hogyan nyerhetném ki automatikusan 1-1 híradó hallássérülteknek szánt feliratát? Elsősorban interneten keresztül. Néhány teletext oldal netről is elérhető, de pl. az RTL 888. oldala, ahol feliratozva adják a híradót, nem. Tehát el szeretném menteni legalább valamelyik híradónak a szövegét egy fájlba.

Hozzászólások

Szia,
Nem tudom, hogy mindenhol ez történik-e, de néhány csatorna (atv, hírtv talán echo is) esetén azt láttam, hogy az online felületre kikerülő videók mellé mellékelt szöveg egy az egyben megegyezik a videó szöveges tartalmával. Nyilván a belső rendszerükből egyszerűen átemelik és nem kell szerkeszteni...

Üdv,
j

Kizarolag internetes megoldas erdekel? A DVB(-T) adasok sokszor tartalmazzak a feliratot (m1 eseten azt hiszem folyamatos (kiveve reklamok)), abbol talan egyszerubb lenne kinyerni.

/sza2

Elsősorban internetes megoldás, mivel az ingyen lenne, és nem kellene hozzá külön eszköz. Az a helyzet, hogy TV-vel másfél évtizede nem találkoztam, mi kellene ahhoz, hogy fel tudjam venni felirattal együtt a híradókat, majd kinyerjem belőlük a feliratot?

A set-top-boxok kódolatlanul mentenek az adathordozóra? És a feliratsávot külön kezelik, tehát pl. az mkv konténerből ki fogom tudni emelni?

Vagyis elég vennem egy set-top-boxot és egy DVB-T antennát (nincs TV-m)? Kell tudnia kezelni a teletextet a set-top-boxnak?

Nekem egy Raspberry Pi-hoz csatlakozik egy USB DVB-T vevo, fut egy tvheadend szerver , ha musort veszek fel transport stream-et ment.

Nem tudom az lenyeges-e, hogy folyamatosan tarolva legyen a felirat, vagy csak on demand kell?

Ha az utobbi, akkor szerintem eleg venni egy olcso DVB-T tunert, bedugni a gepbe, es amikor kell, akkor epp kiszedni a feliratokat.

Van felvett transport stream-em, most nincs idom, de lehet, hogy megnezem mivel mukodik a subtitle extract (talan ffmpeg, vagy hasonlok).

/sza2

PS: leszamitva a 2-3 ezer forintos DVB-T vevot, ez a megoldas is ingyenes, mert az m1 es az RTL Klub is foldi sugarzasu, szabadon elerheto csatorna.

Köszönöm. A lényeg az, hogy amikor megy a híradó, akkor lementsem és eltároljam a feliratot.

Egy ilyen megfelelő lenne? http://www.digitalelektro.hu/termeklap/elektronika/laptoppc-kiegeszitok…

Nem tudom megállapítani, hogy ez tud-e feliratot megjeleníteni az adások alatt és menni fog-e majd a subtitle extract.

Vagy inkább ez? https://www.pcx.hu/termek/alcor-dtv-hs-digit-lis-vev--84783
Vagy ez? https://www.pcland.hu/evolve_mars_hd_dvb-t_usb_tuner__taviranyito__ante…

Igen, ilyenekre gondoltam, szerintem mindegy, hogy milyen marka, amiket linkeltel azokat valoszinuleg a hazai kereskedo is Kinabol veszi, kb. ugyanazok amit ebay-en megtalalsz.

Ha nem surgos, lehet, hogy erdemes ebay-rol megrendelni, ha szamit, hogy kb. 1000-1500Ft-tal olcsobb.

Regebben vettem par ilyen dongle-t, ugy valasztottam, hogy menjen Linux alatt - azokban RTL2832 es R820T chipek voltak (erdekelt az SDR is, azert esett erre a valasztas).

Ehhez hasonlo.

Jelenleg egy Sony PlayTV-t hasznalok, ennek ugy tunik jobb az erzekenysege, dual tuneres es eleg hosszu ideje tamogatott Linux alatt - de azt sem tudom, lehet-e meg kapni, en a volt munkahelyemen talaltam a kidobott cuccok kozott, haz nelkul :-) (ugy volt, hogy gyartani fogjuk, de nem lett belole semmi :'(

Neztem a lementett TS-t, de ugy tunik a felirat nincs benne. Majd meg butykolok vele, de most eleg keves az idom.

Azt nem tudom, hogy hogyan lehetne megcsinalni egyszeruen, hogy nezed a musort es kozben a feliratot mented egy file-ba. A tvheadend ugyan tudja rogziteni es stream-elni is a tartalmat, szoval lehet, hogy nem tul bonyolult megoldani a nezest es a file-ba mentest egyszerre, de meg nem probaltam.

/sza2

Amire jutotottam:

Ha transport stream-et mentek a tvheadend-del, akkor nincs benne a felirat (vagy en nem talaltam, de sehogy).

Atallitottam a tvheadend-et, hogy Matroska kontenerbe pakolja a cuccokat - igy viszont mukodik. Egyreszt az mkvmerge meg tudja mondani milyen stream-ek vannak a file-ban, masreszt az mkvextract ki tudja szedni a feliratot pl. .srt formatumban.


me@debian$ mkvmerge -i M1-HD-Hirado.2015-09-13.22-00.mkv 
File 'M1-HD-H__rad__.2015-09-13.22-00.mkv': container: Matroska
Track ID 0: video (MPEG-4p10/AVC/h.264)
Track ID 1: audio (MP2)
Track ID 2: audio (AC3/EAC3)
Track ID 3: audio (AAC)
Track ID 4: subtitles (SubRip/SRT)
Global tags: 4 entries

A felirat kiszedese:


me@debian$ mkvextract tracks M1-HD-Hirado.2015-09-13.22-00.mkv 4:Hirado.srt

Az eredmeny pedig ilyesmi:


1
00:00:03,040 --> 00:00:03,040
A szenegali vezeto azt tapasztalja,
hogy gyakran az itt élok nyujtanak
eloször segito kezet,


2
00:00:12,384 --> 00:00:12,384
ezért fontos, hogy
együttmuködjenek a helybéliekkel.


3
00:00:13,962 --> 00:00:13,962
A segélyszervezet vezetojét kérdeztük
arrol is, hogy mit gondol a migransok
nyilatkozatairol,


4
00:00:17,589 --> 00:00:17,589
amely szerint jonak talaljak
az itteni ellatast.

Erdekes, hogy az ekezetek nehol hianyoznak, de nem tudom, ez mibol adodik (igy sugarozzak, vagy valahol az en oldalamon nincs jol kezelve).

Termeszetesen nem muszaj a tvheadend-et hasznalni, nekem ez volt keznel (telepitve es konfiguralva), es biztos tud mas is kiszedni feliratot a stream-bol, nem csak az mkvmerge.

Ami a lenyeg, hogy a feladat megoldhatonak latszik.

/sza2

Nagyon köszönöm!

Kérdés. Ez nekem jó lesz? MINI-USB-DVB-T-RTL-SDR-Realtek-RTL2832U-R820T-Tuner-Receiver-MCX-Input-Newest

Tehát ha jól értem, ez tudja a teletextet is, bár ilyet nem látok a távirányítóján, gondolom szoftverből megoldható. Ezzel biztosan fogom tudni fogni a magyar digitális földfelszínű TV adásokat? Vagy te melyiket ajánlod, ha nem ezt?

Ha normalis (eleg eros) a jel (nem tudom helyileg merre vagy) akkor szerintem megfelelo lesz. Mint irtam, az RTL2832 + R820T kombinacio megy Linux alatt OOTB.

A teletext is a DVB-T stream-be van belekodolva, igy az csak szoftver kerdese, hogy mukodik-e. En is kaptam taviranyiot ezekhez, de sosem hasznaltam - az hogy tud-e teletex-et, nem etto fugg (de amit en leirtam, az nem a teletex-bol szedi a feliratot, hanem a stream-ben elerheto a musorhoz tartozo felirat).

/sza2