A notepad-ot remélem viccnek írtad. Persze, hogy bináris trugyi, mert be van csomagolva, meg a formázás amúgy is bináris. De ha ki van csomagolva, a bináris formázás nem zavarja meg a grep-et, hogy szöveges infót nyerjen ki belőle. Küldj egy ilyen pdf fájlt, írok rá scriptet, ami szépen végigmegy fájlonként kibontja stdout-ra, onnan grep kiszedi, ami kell, aztán a kinyert tartalom függvényében végre lesz hajtva rajta valami művelet.
Valami ilyesmit, amit itt írtak:
for file in *.pdf; do pdftk uncompress $file | grep minta; done