'van "master" pdf amiben az eredeti adatra lehe regexet irni'
Szerintem a mutatvány - mint arra Fisher is utalt - itt bukik meg. Nagy valószínűséggel semmilyen, értelmesen illeszthető mintát nem fogsz benne találni. Kipróbáltam a pdftk-s módszeredet egy LibreOffice-ban sima szövegből (Lorem ipsum) előállított pdf-fel. Az uncompressed változatban sem volt semmi felismerhető karaktersorozat az eredetiből.