InformaciÃ³n de URLs

SSdac · February 1, 2008, 1:15pm

Hola a todxs.

Tengo una duda. Â¿Hay alguna forma de obtener informaciÃ³n de una URL que
introduzca un usuario en un campo de texto?

Ejemplo. Yo introduzco la URL en un text field (i.e "
http://www.unblogcualquiera.com") y necesito obtener informaciÃ³n, como
el
tÃtulo de la pÃ¡gina, el feed asociado o incluso su favicon.

Â¿SabÃ©is como se podrÃa hacer?

SSdac · February 1, 2008, 1:40pm

On 01/02/2008, [dac] [email protected] wrote:

Abriéndola con open-uri o mejor con algo de más alto nivel como
hpricot. Una vez allí

a) título el valor del element
b) feed asociado, aquí ya te has metido en un lio bastante grande
(link rel=“alternate” + type, puede, puede solventarte el problema,
pero como todos los temas de agregación exige un poco de vudú y muchas
reglas y excepciones)

c) El favicon, peor que el feed

link rel=“favicon” o buscar un archivo favicon.ico en el raiz del
sitio

La agregación es un tema que me encanta, pero exige paciencia y es
especialmente artesanal, incluso para los estándares artesanales en
los que se mueve la web

Y, a menos que alguien tenga algo mejor que aportar que Hpricot /
open-uri, no dejemos caer este hilo en el offtopic flagrante.
¡Gracias!

–
Manuel, que
piensa que eres una excelente persona y medra en torno a
http://simplelogica.net y/o http://simplelogica.net/logicola/
Recuerda comer mucha fruta y verdura.

SSdac · February 1, 2008, 1:46pm

Muchas gracias, voy a echar un vistazo a ver que puedo hacer.

2008/2/1 Manuel GonzÃ¡lez Noriega [email protected]:

SSdac · February 1, 2008, 1:47pm

Hola,

Ejemplo. Yo introduzco la URL en un text field (i.e
“http://www.unblogcualquiera.com”) y necesito obtener informaciÃ³n,
como el tÃtulo de la pÃ¡gina, el feed asociado o incluso su favicon.

se me ocurre que conectes con la URL, te bajes el html y lo parsees.
Puedes tirar con hpricot que va bastante bien, o directamente con
open-uri te bajas la pÃ¡gina, y con htree la conviertes a XHTML y la usas
como un documento de REXML con xpath directamente.

De esto Ãºltimo tengo un ejemplo (viejo, pero funcional) en

saludos,

javier ramÃrez

SSdac · February 1, 2008, 3:27pm

[dac] escribiÃ³:

–
Daniel A. Castro
[email protected] mailto:[email protected] | skype: dac.ocio
http://www.e-dac.es | http://www.dosmiluno.org

Para los feeds puede que te sirva la gem feedtools [1], yo no la he
probado pero tiene pinta de hacer eso que quieres.

Para lo del tÃtulo y otros datos, quizÃ¡ te sirva la gem metainspector
que hizo Jaime [2], pero mejor que lo diga Ã©l mismo

saludos

[1] http://sporkmonger.com/projects/feedtools/
[2]
http://www.jaimeiniesta.com/2007/12/06/metainspector-mi-primera-gema-ruby/

–
Amaia C.
Dabne TecnologÃas de la InformaciÃ³n - www.dabne.net -
http://blog.dabne.net
*
Apuntes de Rails - http://apuntesderails.amaiac.net

SSdac · February 2, 2008, 1:36am

2008/2/1 Amaia C. [email protected]:

que hizo Jaime [2], pero mejor que lo diga él mismo
*
Apuntes de Rails - http://apuntesderails.amaiac.net

Ror-es mailing list
[email protected]
simplelogica.net

FeedTools, excepto porque es lentísimo, descubre los feeds asociados a
una página sin ningún problema. Lo malo es que hasta hace unos días
que salió una nueva versión llevaba mucho tiempo parado, y no parece
que el autor lo esté manteniendo activamente.