Szöveges tartalom kiszűrése weboldalból

Olyan megoldást keresnék(bármilyen formában), ami képes egy weboldalból kinyerni a puszta szöveges információt és azt valamilyen formában kimenetként visszaadni. Gyakorlatilag bármi ilyen/hasonló érdekelne, ezért is a pongyola megfogalmazás.

Hozzászólások

Sok ilyen megoldás van és a pongyola megfogalmazás itt nem segít.
Egy adott weboldal egy adott helyén levő szövegről van szó?
Vagy bármely weboldalból a belső felépítés figyelmen kívül hagyásával ki kell venni minden szöveget?
Netán a weboldal éppen fókuszban lévő részéről kell kivenni a szöveget?

Sokat segítene, ha elmesélnéd, miért is kell ezt csinálni, hogyan lesz felhasználva? Magyarán: mi a teljes feladat?

Üdv,
Marci

Egy weboldal teljes szövegéről lenne szó, gyakorlatilag az adott weblap betöltése után a felhasználó számára az összes, szövegként megjelenő tartalmat kellene kiszűrni. Az így kapott kimenetet majd fel kell dolgozni úgy, hogy csak az egész mondatok maradjanak benne, azaz ami nagy betűvel kezdődik és ponttal záródik.

a nepszeru programnyelvekhez van html parser (pl javahoz ez), ez feldolgozza neked a cuccot, es utana okos selectorral ki tudod nyerni a megfelelo tartalmat.
de ha csak az egeszrol egyszeru dump kell arra ott vannak a mar emlitett konzolos parancsok

--
A vegtelen ciklus is vegeter egyszer, csak kelloen eros hardver kell hozza!