f a b r i z i o v e n e r a n d i <fabr...@venerandi.boh> wrote:
> Il 10/04/14 07.44, ... ha scritto:
>
>> pdfinfo può dirti il numero totale di pagine (utile per impostare
>> gl'estremi del ciclo).
>> pdftk può spezzare il file in un file per pagina. pdf2txt trasforma ogni
>> singola pagina in testo, così puoi agevolmente leggere la prima riga e
>> verifica se sia vuota (sostituibile con
getpdftext.pl)
>
>
> L'idea è interessante... e se c'è una immagine come si comporta pdf2txt?
Penso venga trasformata in pagina vuota. Se la tua esigenza è mantenere
pagine composte solo da un'immagine, potresti raccogliere tutte le pagine
considerate vuote da pdf2txt e verificare i falsi positivi andando a
controllare la pagina singola originale. Non saprei come 'beccare' le foto,
ma penso qualcosa dalle parti di ImageMagik?
P.S. usando tr identifichi tutte le pagine contenenti solo caratteri non
stampabili. Posto che ogni immagine abbia almeno una didascalia, dovresti
evitare eventuali falsi positivi