Forum: Italian Ruby user group I: hlep- ho un problema

Announcement (2017-05-07): www.ruby-forum.com is now read-only since I unfortunately do not have the time to support and maintain the forum any more. Please see rubyonrails.org/community and ruby-lang.org/en/community for other Rails- und Ruby-related community platforms.
(Guest)
on 2008-12-15 17:47
(Received via mailing list)
Devo realizzare in ruby un programma che data una pagina web rintracci
dei
file testuali in essa contenuti e ne faccia il parsing in un file xml.
Il mio
problema è quello di trovare questi file testuali...>Una volta che
attraverso
la libreria open-uri scarico tutto il file html associato a quella
pagina come
faccio a rintracciare i fiel. Grazie  per l'aiuto
Luca de Marinis (Guest)
on 2008-12-15 18:27
(Received via mailing list)
removed_email_address@domain.invalid wrote:
>
> Devo realizzare in ruby un programma che data una pagina web rintracci dei
> file testuali in essa contenuti e ne faccia il parsing in un file xml. Il mio
> problema è quello di trovare questi file testuali...>Una volta che attraverso
> la libreria open-uri scarico tutto il file html associato a quella pagina come
> faccio a rintracciare i fiel. Grazie  per l'aiuto
>
>
Intendi dei files testuali linkati dalla pagina da cui parti?
Dovresti dare un'occhiata alla gemma hpricot ; in linea di massima, ti
fai dare da hpricot i nodi di tipo 'a', li esamini per vedere se puntano
a un file di testo (si spera che sia sufficiente vedere se linkano a
qualcosa che finisce in .txt, altrimenti e' un bel po' piu' complicato),
poi per ognuno dei files trovati ci fai quello che vuoi (a dire il vero
non capisco perche' parli di parsing dei files testuali, un xml si
parsa, un file testuale si legge dato che non ha struttura!).

Dai un occhiata al minitutorial:

http://code.whytheluckystiff.net/hpricot/

Ciao

--

________________________________________________________________________

*Luca S.G. de Marinis
*/Senior developer/**

 Roma - tel.+39.0658318301 fax.+39.0658318303 P.I. 04856801008 **

*
*Rispetta l'ambiente e non stampare questa e-mail a meno che non ti sia
realmente utile.
Please consider the environment and don't print this e-mail unless you
really need to.

*NOTE SULLA PRIVACY*
Le informazioni trasmesse attraverso la presente e-mail ed i suoi
allegati sono diretti esclusivamente al
destinatario e devono ritenersi riservati con divieto di diffusione e di
uso. La diffusione e la comunicazione
da parte di soggetto diverso dal destinatario è vietata dall'art. 616 e
ss. c.p. e dal d. l.vo n. 196/03.
Se la presente e-mail ed i suoi allegati fossero stati ricevuti per
errore da persona diversa dal destinatario
siete pregati di distruggere tutto quanto ricevuto e di informare il
mittente con lo stesso mezzo.
________________________________________________________________________
This topic is locked and can not be replied to.