Forum: Italian Ruby user group R: Re: Buon 2009 e Consigli

Announcement (2017-05-07): www.ruby-forum.com is now read-only since I unfortunately do not have the time to support and maintain the forum any more. Please see rubyonrails.org/community and ruby-lang.org/en/community for other Rails- und Ruby-related community platforms.
E45ea059ab1aade51fe040dafd1022b0?d=identicon&s=25 piccio84@libero.it (Guest)
on 2009-01-02 14:34
(Received via mailing list)
Raccolgo volentieri il consiglio e vi espongo il problema.
Devo far per motivi accademici un programma che effettua :
1) Il download di file testuali contenenti libri
2) rintracciare su questi file testuali il titolo, i personaggi e
costruirci
un file xml.

Come punto 1 ho preso il sito di riferimento che contiene una lista di
link
alcuni con  alt=[DIR] che contengono un link ad un altra directory e
altri con
alt=[TXT]. I devo scaricare tutti i file txt contenuti nelle varie
directory .
Per fare ciò sto cercando di ripulire il codice html con esprssioni
regolari, e
successivamente creare due file txt uno con i file da scaricare e
l'altro con
le directory da visitare.
Tutto questo aprendo le varie pagine html con la gemma open-uri.
Ma c'è un modo più elegante per il download dei file testuali?

Per il punto due ancora non ho messo mano. Suggerimenti?
0df4a6c75caf1bd9b01d2dcbfb085ee4?d=identicon&s=25 Sandro Paganotti (Guest)
on 2009-01-02 15:19
(Received via mailing list)
Per scaricare / navigare ed estrapolare infos da file xml/html ti
consiglio
scrubyt  :D E' fantastico !!
Ti passo un pò di esempi che ho trovato su github:

http://github.com/scrubber/scrubyt_examples/tree/master
D8fb06dfc08a477ecb0a76ffdbff3475?d=identicon&s=25 Chiaro Scuro (chiaroscuro)
on 2009-01-03 01:56
(Received via mailing list)
On 1/2/09, Sandro Paganotti <sandro.paganotti@gmail.com> wrote:
>
> Per scaricare / navigare ed estrapolare infos da file xml/html ti consiglio
> scrubyt  :D E' fantastico !!
> Ti passo un pò di esempi che ho trovato su github:
>
> http://github.com/scrubber/scrubyt_examples/tree/master
>

scrubyt e' grande quando va. ci sono dei casi in cui non funzionava ed
era
indebuggabile.
la dsl di scrubyt e' molto fichetta, ma in molti casi un metodo +
brutale
con un po di regexp e hpricot e' piu' debuggabile.
This topic is locked and can not be replied to.