Leggere PDF

Con PDF/Writer si possono scrivere documenti PDF, ma per leggerli?
Qualcuno si è già imbattuto in questo problema?

Ciao Michele.

Michele C. wrote:

Con PDF/Writer si possono scrivere documenti PDF, ma per leggerli?
Qualcuno si è già imbattuto in questo problema?

Cioè? Cosa devi farci? Parsare il testo? Copiare le immagini?
Convertirlo in HTML?

Leggere la prima pagina e scrivere un altro PDF.

Ciao Michele

2008/7/6 Michele C. [email protected]:

Leggere la prima pagina e scrivere un altro PDF.

non so come sia fatto il pdf che ti interessa. puoi provare i vari
tool pdftotext, pdftohtml etc., che estraggono appunto il testo e
(solo parzialmente) il layout del pdf. ovviamente, non ti aspettare
miracoli: il formato PDF non contiene testo formattato nel senso di
altri formati, ma sostanzialmente stringhe e coordinate (esempio: non
testo centrato, ma testo alle tali coordinate x e y), per cui un
qualunque parser deve fare una fatica immane per capire il layout.

Io sto guardando libpoppler e sembra interessante… ovviamente
converti da PDF a XML/HTML e poi ti armi di XSLT (+ tanta pazienza…)

Il 6 luglio 2008 22.33, Michele C. [email protected] ha scritto: