Csoportos fájlvizsgálat - szortírozással

Fórumok

Sziasztok!

Szeretném a segítségeteket kérni abban, hogy hogyan tudnám az adott mappában a sérült fájlokat kiszűrni. Több ezer darabról van szó így elég nehéz lenne egyesével átböngészni.
Fejléces visszaállítás volt, így sok a sérült fájl ezeket szeretném leválogatni. PDF,DOC,XLS egyéb kiterjesztésekben.
Esetlegesen van arra lehetőség, hogy az első sornak megfelelően át is nevezze a fájlokat?
Ilyen szinten sajnos nem ismerem a szerkezetet, jó lenne ha tudnék segítséget-megoldást kapni ez ügyben!

Előre is köszönöm a javaslatokat!

- UPDATE -

catdoc, pdftk -val már előrébb jutottam, xls-re jó lenne ötlet!

Hozzászólások

xls-t perl-bol scriptelnem a Spreadsheet::ParseExcel modullal. De szerintem van ra meg vagy ket tucat egyeb modul is.

Reszlet a doksijabol:


Spreadsheet::ParseExcel(3)               User Contributed Perl Documentation               Spreadsheet::ParseExcel(3)



NAME
       Spreadsheet::ParseExcel - Read information from an Excel file.

SYNOPSIS
           #!/usr/bin/perl -w

           use strict;
           use Spreadsheet::ParseExcel;

           my $parser   = Spreadsheet::ParseExcel->new();
           my $workbook = $parser->parse('Book1.xls');

           if ( !defined $workbook ) {
               die $parser->error(), ".\n";
           }

           for my $worksheet ( $workbook->worksheets() ) {

               my ( $row_min, $row_max ) = $worksheet->row_range();
               my ( $col_min, $col_max ) = $worksheet->col_range();

               for my $row ( $row_min .. $row_max ) {
                   for my $col ( $col_min .. $col_max ) {

                       my $cell = $worksheet->get_cell( $row, $col );
                       next unless $cell;

                       print "Row, Col    = ($row, $col)\n";
                       print "Value       = ", $cell->value(),       "\n";
                       print "Unformatted = ", $cell->unformatted(), "\n";
                       print "\n";
                   }
               }
           }

DESCRIPTION
       The Spreadsheet::ParseExcel module can be used to read information from Excel 95-2003 binary files.

       The module cannot read files in the Excel 2007 Open XML XLSX format. See the Spreadsheet::XLSX module instead.