Van egy rakás html táblázatom amit a R-project számára emészthető alakba kellene hoznom. Tud valaki valami normális eljárást arra, hogy valami egyszerű TAB-al határolt szöveges fájlt képezzek belőlük, vagy esetleg egy az OOo által beolvasható formátumot?
- 1143 megtekintés
Hozzászólások
1.) szövegfeldógózó programok?
2.) valami tetszőleges, számodra kedves "nyelven" valami script?
--
trey @ gépház
- A hozzászóláshoz be kell jelentkezni
Köszi eddig én is eljutottam de valami konkrét javaslatot várnék. pl: XY program
- A hozzászóláshoz be kell jelentkezni
Nézd meg ezt. Van hozzá forráskód is, ha többet akarsz kihozni belőle.
- A hozzászóláshoz be kell jelentkezni
en sed-el probalkoznek, es CSV file-t gyartanek belole, amit ooCalc siman olvas
eloszor vagd ki a <table> es </table> kozti reszeket, aztan irtsd ki az ujsor karaktereket
majd a maradekot kuldd at a sed-en
a kovetkezo regexpek segithetnek:
minden adat utan pontosvesszot tesz
s@</td>@;@g
uj sor karaktert szur be oda, ahova kell
s@</tr>@\n@g
a maradek html tageket kiirtja
s@<[^>]*>@@g
- A hozzászóláshoz be kell jelentkezni
Ez a te barátod
html2text - an advanced HTML-to-text converter
- A hozzászóláshoz be kell jelentkezni
vagy csak próbáld meg a paste special-t ooo-ban
- A hozzászóláshoz be kell jelentkezni