Información de URLs

Hola a todxs.

Tengo una duda. ¿Hay alguna forma de obtener información de una URL que
introduzca un usuario en un campo de texto?

Ejemplo. Yo introduzco la URL en un text field (i.e "
http://www.unblogcualquiera.com") y necesito obtener información, como
el
título de la página, el feed asociado o incluso su favicon.

¿Sabéis como se podría hacer?

On 01/02/2008, [dac] [email protected] wrote:

Abriéndola con open-uri o mejor con algo de más alto nivel como
hpricot. Una vez allí

a) título el valor del element
b) feed asociado, aquí ya te has metido en un lio bastante grande
(link rel=“alternate” + type, puede, puede solventarte el problema,
pero como todos los temas de agregación exige un poco de vudú y muchas
reglas y excepciones)

c) El favicon, peor que el feed

  • link rel=“favicon” o buscar un archivo favicon.ico en el raiz del
    sitio

La agregación es un tema que me encanta, pero exige paciencia y es
especialmente artesanal, incluso para los estándares artesanales en
los que se mueve la web

Y, a menos que alguien tenga algo mejor que aportar que Hpricot /
open-uri, no dejemos caer este hilo en el offtopic flagrante.
¡Gracias!


Manuel, que
piensa que eres una excelente persona y medra en torno a
http://simplelogica.net y/o http://simplelogica.net/logicola/
Recuerda comer mucha fruta y verdura.

Muchas gracias, voy a echar un vistazo a ver que puedo hacer.

2008/2/1 Manuel González Noriega [email protected]:

Hola,

Ejemplo. Yo introduzco la URL en un text field (i.e
http://www.unblogcualquiera.com”) y necesito obtener información,
como el título de la página, el feed asociado o incluso su favicon.

se me ocurre que conectes con la URL, te bajes el html y lo parsees.
Puedes tirar con hpricot que va bastante bien, o directamente con
open-uri te bajas la página, y con htree la conviertes a XHTML y la usas
como un documento de REXML con xpath directamente.

De esto último tengo un ejemplo (viejo, pero funcional) en
http://formatinternet.wordpress.com/2006/12/06/parsear-xml-o-html-mal-formado/

saludos,

javier ramírez

[dac] escribió:


Daniel A. Castro
[email protected] mailto:[email protected] | skype: dac.ocio
http://www.e-dac.es | http://www.dosmiluno.org

Para los feeds puede que te sirva la gem feedtools [1], yo no la he
probado pero tiene pinta de hacer eso que quieres.

Para lo del título y otros datos, quizá te sirva la gem metainspector
que hizo Jaime [2], pero mejor que lo diga él mismo :wink:

saludos

[1] http://sporkmonger.com/projects/feedtools/
[2]
http://www.jaimeiniesta.com/2007/12/06/metainspector-mi-primera-gema-ruby/


Amaia C.
Dabne Tecnologías de la Información - www.dabne.net -
http://blog.dabne.net
*
Apuntes de Rails - http://apuntesderails.amaiac.net

2008/2/1 Amaia C. [email protected]:

que hizo Jaime [2], pero mejor que lo diga él mismo :wink:
*
Apuntes de Rails - http://apuntesderails.amaiac.net


Ror-es mailing list
[email protected]
http://lists.simplelogica.net/mailman/listinfo/ror-es

FeedTools, excepto porque es lentísimo, descubre los feeds asociados a
una página sin ningún problema. Lo malo es que hasta hace unos días
que salió una nueva versión llevaba mucho tiempo parado, y no parece
que el autor lo esté manteniendo activamente.

This forum is not affiliated to the Ruby language, Ruby on Rails framework, nor any Ruby applications discussed here.

| Privacy Policy | Terms of Service | Remote Ruby Jobs