R: Re: I: hlep- ho un problema


#1

Vi ringrazio per l’aiuto. Vi spiego in dettaglio il mio problema :
Su una pagina web c’è un input box dove immettere il nome di un libro poi
si
cliccka il pulsante Go
Il sito internet restitutuisce il libro in formao txt.
Io devo prelevare tutti i file che rappresentano libri e poi di ogni
file
creare una struttura xml che contenga una sorta di parsing semantico.
Grazie ancora, ma ancora con il ruby sono alle prismissime armi…

----Messaggio originale----
Da: removed_email_address@domain.invalid
Data: 15/12/2008 17.26
A: "ruby-it"removed_email_address@domain.invalid
Ogg: Re: [ruby-it] I: hlep- ho un problema

removed_email_address@domain.invalid wrote:

Devo realizzare in ruby un programma che data una pagina web rintracci
dei

file testuali in essa contenuti e ne faccia il parsing in un file xml. Il
mio

problema è quello di trovare questi file testuali…>Una volta che
attraverso

la libreria open-uri scarico tutto il file html associato a quella pagina
come


#2

removed_email_address@domain.invalid wrote:

Vi ringrazio per l’aiuto. Vi spiego in dettaglio il mio problema :
Su una pagina web c’è un input box dove immettere il nome di un libro poi si
cliccka il pulsante Go
Il sito internet restitutuisce il libro in formao txt.
Io devo prelevare tutti i file che rappresentano libri e poi di ogni file
creare una struttura xml che contenga una sorta di parsing semantico.
Grazie ancora, ma ancora con il ruby sono alle prismissime armi…

E allora il problema sembrerebbe non tanto quello di parsare l’output,
quanto piuttosto decidere cosa ci scrivi nell’input box!
Comunque, visto che i risultati “finali”, cioe’ i libri, ti tornano
comunque in formato txt, sembrerebbe che dovresti meccanizzare l’invio
della form con il nome di un libro nella input box.
Diciamo che in un file di testo ti scrivi i nomi dei libri, uno per
riga. Poi per ogni riga con la libreria Net::HTTP (o forse c’e’ anche
qualcosa di + semplice) simuli l’invio della form. Poi resta il problema
che parsare semanticamente un file di testo richiederebbe l’invenzione
di una intelligenza artificiale :wink:

Ammesso che il sito si chiami www.sitodeilibri.it e che l’azione
invocata dal normale submit di ricerca sia steal.cgi, e che la text box
abbia nome q, qualcosa del tipo:

require ‘net/http’
require ‘uri’

File.open(“nomi_dei_libri.txt”).each { |line|

#1: Simple POST
res = 

Net::HTTP.post_form(URI.parse(‘http://www.sitodeilibri/steal.cgi’),
{‘q’=> line })
puts res.body
}

Questo te li stamperebbe a schermo, che probabilmente non e’
l’intelligenza artificiale che vai cercando, ma e’ un inizio!

Ciao


Luca S.G. de Marinis
/Senior developer/

Roma - tel.+39.0658318301 fax.+39.0658318303 P.I. 04856801008 **

*Rispetta l’ambiente e non stampare questa e-mail a meno che non ti sia
realmente utile.
Please consider the environment and don’t print this e-mail unless you
really need to.

NOTE SULLA PRIVACY
Le informazioni trasmesse attraverso la presente e-mail ed i suoi
allegati sono diretti esclusivamente al
destinatario e devono ritenersi riservati con divieto di diffusione e di
uso. La diffusione e la comunicazione
da parte di soggetto diverso dal destinatario è vietata dall’art. 616 e
ss. c.p. e dal d. l.vo n. 196/03.
Se la presente e-mail ed i suoi allegati fossero stati ricevuti per
errore da persona diversa dal destinatario
siete pregati di distruggere tutto quanto ricevuto e di informare il
mittente con lo stesso mezzo.