Convertire insiemi di pdf in jpg

Per leggere meglio la rassegna stampa del Comune di Forlì, ho creato uno script che mi scarica i pdf e me li converte in jpg, archiviandomeli in una cartella giornaliera. Chiamate questo script una volta al giorno ed avrete lo storico delle rassegne del Comune. Ovviamente questo script si può adattare anche in altri ambiti, è abbastanza semplice.


#!/bin/bash
directory=`date +%x | tr "/" "-"`
directory=storico/$directory
mkdir $directory
if [ $? == 0 ]; then
curl http://www.comune.forli.fo.it/rassegna/[00000001-0000150].pdf -o \#1.pdf
#cancello tutti i file vuoti
rm `ls -la | grep pdf | grep 4040 | cut -f 14 -d " "`
for articolo in `ls -1 *.pdf`
do
pdfimages $articolo $articolo
convert $articolo-000.pbm -scale 40% -negate -quality 30 $directory/$articolo.jpg
done
rm *.pbm
# album rassegna -index index -medium 800x600
fi
exit 0

Per eseguirlo è necessario avere installato xpdf, che contiene al suo interno il programma pdfimages.
Questo script può essere eseguito su linux, ma anche sugli altri sistemi operativi nei quali è possibile installare bash, curl ed xpdf (ipoteticamente tutti, ma non ho fatto la prova).

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *