Antispam OCR

Spamassassin combatte egregiamente lo spam, a patto che le mail contengano testo. Ma purtroppo in molti casi i messaggi vengono inviati sotto forma di immagini, e come si può presupporre questa modalità non può essere vagliata in alcun modo da un programma testuale. Una soluzione a questo è un plugin per Spamassassin che decifri un immagine in testo, quindi un OCR.
Il programma in questione si chiama FuzzyOCR e si trova al seguente indirizzo: Fuzzyocr

Scaricare il file tar.gz e decomprimerlo con:

tar xzf fuzzyocr-3.5.1-devel.tar.gz

Quindi copiare il contenuto della cartella dentro a /etc/mail/spamassassin
Ora perché funzioni bisogna installare i seguenti pacchetti:

aptitude install gifsicle netpbm ocrad libmldbm-sync-perl libstring-approx-perl gocr imagemagick libgocr0 libungif-bin

A questo punto è meglio fare una prova per vedere se qualcosa non funziona:

su -c "spamassassin --debug FuzzyOcr < /etc/mail/spamassassin/samples/ocr-animated.eml > /dev/null" amavis

Se non viene trovato il file Timeout.pm bisogna prenderlo dal file sorgente di Spamassassin che si trova nel sito, una volta scaricato e decompresso il file copiarlo con:

cp Mail-SpamAssassin-3.1.8/lib/Mail/SpamAssassin/Timeout.pm /usr/share/perl5/Mail/SpamAssassin

Infine è da dire che FuzzyOCR funziona dalla versione 3.1.8 di Spamassassin, non presente in Dapper. Una soluzione è scaricare l’ultima versione con cpan:

cpan Mail::SpamAssassin

Comments are closed.