Lettura file da URL

Ciao a tutti,
ho un problema con lo scaricamento e lettura di un file da internet.
Praticamente devo leggere un file pdf da URL e convertirlo a testo
utilizzando
un programma esterno (pdftotext) nel seguente modo:

open(filename,“w”).write(open(path).read)
pdf_text = %x{pdftotext #{options} #{filename} - 2>/dev/null}

E’ giusto come procedimento?Il problema, penso, è che nel leggere il file
da
internet perda qualche informazione sul PDF, perchè non riesce a
convertirlo.
Se invece provo con un file locale va tutto a buon fine.
C’è un altro modo per scaricare un file da internet ed essere sicuri che
sia
identico bit a bit? :slight_smile:
Grazie!

hashing del fileda shell: md5 filename.pdf
se non hai md5 prova con md5sum

Luca