Mármint a wc simán megmondta, hogy hány bájt az a file ;)
Viszont vicces, de a sima docrol a 'file' elmondja, hogy szerinte hány char meg world, bár a véleménye a random próbán nem egyezett a libreofficéval.
Én lehet, hogy megpróbálkoznék pandoccal dumpolni a benne levő textet, az egész sok mindent megért, és azt wc-zni. pdfet mondjuk ha jól emlékszem nem beszél, azt valami mással kell 2txt-zni.
Beton biztos így se lesz, lehet hogy némi nézegetés után még utószűrnék szemétre, mert a jó isten se tudja, hogy pl egy táblázat hogy jelenik meg.