Agragador noticias RSS

Hola a todos,
necesito programar un planeta en Ruby On Rails, del estilo de:

http://planetarails.com ó http://www.planetrubyonrails.org

¿Alguien sabe si existe algún proyecto libre?
En caso de no existir, supongo que los pasos son leer los feeds de unas
determinadas páginas y almacenarlos en mi base de datos, ¿pero como se
si existen noticias nuevas o cual fue la última noticia que guardé de un
sitio? ¿Las borro todas y vuelvo a cargar las X últimas? Ne me queda muy
claro el funcionamiento. Si alguien me pudiera orientar se lo
agradecería.

Un saludo.

On 11/3/07, Mario S. [email protected] wrote:

Hola a todos,

Buenos días.

necesito programar un planeta en Ruby On Rails, del estilo de:

http://planetarails.com ó http://www.planetrubyonrails.org

¿Alguien sabe si existe algún proyecto libre?

Yo la verdad no conozco nada.

En caso de no existir, supongo que los pasos son leer los feeds de unas

determinadas páginas y almacenarlos en mi base de datos, ¿pero como se
si existen noticias nuevas o cual fue la última noticia que guardé de un
sitio?

Tienes dos opciones.

  1. La elegante, sería mediante la implementeación de un linkback, o
    sistema
    de noticificaciones en todos los bloguers, de tal manera que cuando
    hiciesen
    una nueva entrada, harían una llamada a tu rcp, en la misma consulta
    puedes
    leer su rss, o incluso en el propio pingback podrían ir los datos (eso
    no lo
    recuerdo). Mírate [1] y [2].

  2. Esta suele ser más común, y es mediante el uso de planificador de
    tareas.
    En windows no se como se hace, pero en sistemas *Nix (linux, bsds y osx)
    se
    usan sistemas como cron. En este caso, lo más cómodo sin alnalizarlo
    mucho,
    sería hacer un cron que hiciese un wget, curl o fetch (vamos que fuese
    al
    planet), y solicitase el recurso encargado de leer todos los datos. Para
    ser
    más esquemático: Es como si pones a tu suegra a consultar cada 5 minutos
    a
    http://www.supermegachupiplanet.es/feeds/updateAll. Otra alternativa,
    sería
    hacer un script local que se encargase de la tarea.

¿Las borro todas y vuelvo a cargar las X últimas?

Eso seían parámetros del diseño que tendrías que elegir. Si analizas un
feed
en formato por ejemplo rss 2.0: ((cojo por ejemplo un feed de wp, que
suelen
ser bastante éticos):

Pequeño planeta http://www.ster-eo.net Thu, 01 Nov 2007 18:20:42 +0000 http://wordpress.org/?v=2.3 en Porque las mujeres controlan el mundo… Post.url Post.url de los comments Thu, 25 Oct 2007 21:37:20 +0000 ster-eo http://www.ster-eo.net/2007/porque-las-mujeres-controlan-el-mundo http://www.ster-eo.net/2007/porque-las-mujeres-controlan-el-mundo/feed

Como puedes ver, no existe referencia a un id, por lo que tendrás que
definir por que elemento indexas (si por el título, si por el link, si
por
la fecha…) Esto es por que un post puede sufrir modificaciones de
título,
link y fecha. Yo creo que optaría por fecha. Cuando se actualiza el
feed,
este añade nuevos item a la parte superior. Si te limitas a mostar y no
almacenas artículos, puedes leer el feed, y sobreescribir el anterior.
Si lo
almacenas (cosa que no voy a entrar a decir por que considero útil),
simplemente tendrías que ver cual es el nuevo y añadirlo a tu base de
datos.

Ne me queda muy

claro el funcionamiento. Si alguien me pudiera orientar se lo
agradecería.

Espero haberte orientado un poco.

Un saludo.

Otro.

[1] Linkback - Wikipedia
[2] Update Services « WordPress Codex

Pensando un poco más en ello mientras desayunaba, yo haría una solución
más
fácil.

Incrustar el feed de un agregador de noticias on-line.
Inconveniente: el retraso (cosa que el método del pingback no tiene, es
instantaneo. Se publica -> Se muestra en el planet).

El tiempo de actualización sería aqui: Tiempo de actualización del feed
en
el blog del planetero + el tiempo que, por ejemplo google reader, tarda
en
releer sus feeds + el tiempo que tu tardas en leer el feed de google.
Ventajas, delegas toda la lógica de programación, a google, guardas el
histórico en google y solamente trabajarías con un feed.

Para casos sencillos y diseños conceptuales, puede ser una opción muy
válida.

Otra mejora del linkback, es que si el blogger tiene varios tipos de
posts,
sería el quien decidiese de cuales hacer pingback.

On 03/11/2007, Mario S. [email protected] wrote:

claro el funcionamiento. Si alguien me pudiera orientar se lo
HTTP Conditional Get for RSS Hackers - The Fishbowl

Si un sistema de publicacíon no te proporciona la
informaciónnecesaria para hacer get condicional simplemente lo dejas fuera.


Manuel, que
piensa que eres una excelente persona y medra en torno a
http://simplelogica.net y/o http://simplelogica.net/logicola/
Recuerda comer mucha fruta y verdura.

Muchas gracias a todos por vuestras respuestas, gracias de verdad.
Sobre Feevy, no lo conocía y parece muy interesante…pero el problema
es que el enlace de código está caido (Feevy.com is for sale | HugeDomains).
¿Me pueden indicar de donde descargarlo?

Gracias.

Juantomas Garcia wrote:

yo le dar�a un vistazo a feevy tiene mucha de la funcionalidad que
buscas, es software libre

yo le daría un vistazo a feevy tiene mucha de la funcionalidad que
buscas, es software libre y lo ha desarrollado mi amigo David de
Ugarte que es igual de decisivo que de las dos anteriores.

saludos
juantomás

On 11/3/07, Manuel González Noriega [email protected]
wrot