Forum: Italian Ruby user group R: Re: I: hlep- ho un problema

Announcement (2017-05-07): www.ruby-forum.com is now read-only since I unfortunately do not have the time to support and maintain the forum any more. Please see rubyonrails.org/community and ruby-lang.org/en/community for other Rails- und Ruby-related community platforms.
E45ea059ab1aade51fe040dafd1022b0?d=identicon&s=25 piccio84@libero.it (Guest)
on 2008-12-15 23:13
(Received via mailing list)
Vi ringrazio per l'aiuto.  Vi spiego in dettaglio il mio problema :
Su una pagina web c'è un input box dove immettere il nome di un libro poi
si
cliccka il pulsante Go
Il sito internet restitutuisce il libro in formao txt.
Io devo prelevare tutti i file che rappresentano libri e poi di ogni
file
creare una struttura xml che contenga una sorta di parsing semantico.
Grazie ancora, ma ancora con il ruby sono alle prismissime armi....

>----Messaggio originale----
>Da: loop@interact.it
>Data: 15/12/2008 17.26
>A: "ruby-it"<ml@lists.ruby-it.org>
>Ogg: Re: [ruby-it] I: hlep- ho un problema
>
>piccio84@libero.it wrote:
>>
>> Devo realizzare in ruby un programma che data una pagina web rintracci
dei
>> file testuali in essa contenuti e ne faccia il parsing in un file xml. Il
mio
>> problema è quello di trovare questi file testuali...>Una volta che
attraverso
>> la libreria open-uri scarico tutto il file html associato a quella pagina
come
B9aa48577a4934dd46251413485ebac7?d=identicon&s=25 Luca de Marinis (Guest)
on 2008-12-16 11:48
(Received via mailing list)
piccio84@libero.it wrote:
> Vi ringrazio per l'aiuto.  Vi spiego in dettaglio il mio problema :
> Su una pagina web c'è un input box dove immettere il nome di un libro poi si
> cliccka il pulsante Go
> Il sito internet restitutuisce il libro in formao txt.
> Io devo prelevare tutti i file che rappresentano libri e poi di ogni file
> creare una struttura xml che contenga una sorta di parsing semantico.
> Grazie ancora, ma ancora con il ruby sono alle prismissime armi....
>
>

E allora il problema sembrerebbe non tanto quello di parsare l'output,
quanto piuttosto decidere cosa ci scrivi nell'input box!
Comunque, visto che i risultati "finali", cioe' i libri, ti tornano
comunque in formato txt, sembrerebbe che dovresti meccanizzare l'invio
della form con il nome di un libro nella input box.
Diciamo che in un file di testo ti scrivi i nomi dei libri, uno per
riga. Poi per ogni riga con la libreria Net::HTTP (o forse c'e' anche
qualcosa di + semplice) simuli l'invio della form. Poi resta il problema
che parsare semanticamente un file di testo richiederebbe l'invenzione
di una intelligenza artificiale ;)

Ammesso che il sito si chiami www.sitodeilibri.it e che l'azione
invocata dal normale submit di ricerca sia steal.cgi, e che la text box
abbia nome q, qualcosa del tipo:

require 'net/http'
require 'uri'

File.open("nomi_dei_libri.txt").each { |line|

    #1: Simple POST
    res =
Net::HTTP.post_form(URI.parse('http://www.sitodeilibri/steal.cgi'),
                              {'q'=> line })
    puts res.body
}

Questo te li stamperebbe a schermo, che probabilmente non e'
l'intelligenza artificiale che vai cercando, ma e' un inizio!

Ciao

--

________________________________________________________________________

*Luca S.G. de Marinis
*/Senior developer/**

 Roma - tel.+39.0658318301 fax.+39.0658318303 P.I. 04856801008 **

*
*Rispetta l'ambiente e non stampare questa e-mail a meno che non ti sia
realmente utile.
Please consider the environment and don't print this e-mail unless you
really need to.

*NOTE SULLA PRIVACY*
Le informazioni trasmesse attraverso la presente e-mail ed i suoi
allegati sono diretti esclusivamente al
destinatario e devono ritenersi riservati con divieto di diffusione e di
uso. La diffusione e la comunicazione
da parte di soggetto diverso dal destinatario è vietata dall'art. 616 e
ss. c.p. e dal d. l.vo n. 196/03.
Se la presente e-mail ed i suoi allegati fossero stati ricevuti per
errore da persona diversa dal destinatario
siete pregati di distruggere tutto quanto ricevuto e di informare il
mittente con lo stesso mezzo.
________________________________________________________________________
This topic is locked and can not be replied to.