Ciao a tutti,
ho un problema con lo scaricamento e lettura di un file da internet.
Praticamente devo leggere un file pdf da URL e convertirlo a testo
utilizzando
un programma esterno (pdftotext) nel seguente modo:
open(filename,"w").write(open(path).read)
pdf_text = %x{pdftotext #{options} #{filename} - 2>/dev/null}
E' giusto come procedimento?Il problema, penso, è che nel leggere il file
da
internet perda qualche informazione sul PDF, perchè non riesce a
convertirlo.
Se invece provo con un file locale va tutto a buon fine.
C'è un altro modo per scaricare un file da internet ed essere sicuri che
sia
identico bit a bit? :)
Grazie!
on 2009-06-26 13:59
Please log in before posting. Registration is free and takes only a minute.
Existing account
(Switch to SSL-encrypted connection)
NEW: Do you have a Google/GoogleMail or Yahoo account? No registration required!
Log in with Google account | Log in with Yahoo account
Log in with Google account | Log in with Yahoo account
No account? Register here.