¿Cómo haría que las entradas de fuentes RSS estuvieran disponibles por más tiempo de lo que son accesibles desde la fuente?

Mi computadora en casa está configurada para descargar automáticamente algunas cosas de fuentes RSS (principalmente torrents y podcasts). Sin embargo, no siempre mantengo esta computadora encendida. Los sitios a los que me suscribo tienen un rendimiento relativamente grande, por lo que cuando enciendo la computadora no tiene idea de lo que se perdió entre el momento en que se apagó y la última actualización.

¿Cómo harías para almacenar las entradas de feeds durante un período de tiempo más largo de lo que están disponibles en los sitios reales?

Revisé las canalizaciones de Yahoo y no encontré esa funcionalidad, Google Reader puede hacerlo, pero requiere un marcado manual de cada elemento. Magpie RSS para PHP puede hacer el almacenamiento en caché, pero eso es solo para evitar recuperar el feed demasiado y no almacenar más entradas.

Tengo acceso a un servidor web (LAMP) que funciona las 24 horas del día, los 7 días de la semana, por lo que una solución que use un php/mysql sería excelente, cualquier servicio web existente también sería genial.

Podría escribir mi propio código para hacer esto, pero estoy seguro de que tiene que ser un problema que alguien haya tenido anteriormente.

What I did: I wasn't aware you could share an entire tag using Google reader, thanks to Mike Wills for pointing this out. Once I knew I could do this it was simply a matter of adding the feed to a separate Google account (not to clog up my personal reading list), I also did some selective matching using Yahoo pipes just to get the specific entries I was interested in, this too to minimize the risk that anything would be missed.

1

4 Respuestas

Parece que Google Reader hace todo lo que está buscando. No estoy seguro de lo que quiere decir con marcar elementos individuales; tendría que hacer eso con cualquier agregador de RSS.

2
agregado
Google Reader no pone a disposición del público ninguno de sus feeds, excepto los artículos compartidos, eso es lo que quiero decir con "marcar". Pero podría descubrir una forma de iniciar sesión en Google Reader desde un script ...
agregado el autor grapefrukt, fuente

Uso Google Reader para mis suscripciones a podiobooks.com. Agregué todos los feeds a una etiqueta, en este caso podiobooks.com, que comparto (pero no comparto la URL). Luego agrego la fuente RSS a iTunes. Ejemplo aquí .

1
agregado
Estaría maldito, no sabía que podría compartir etiquetas enteras. Definitivamente voy a mirar esto!
agregado el autor grapefrukt, fuente

Parece que quiere algún tipo de servicio que verifique el feed RSS cada X minutos, para que pueda descargar cada artículo/artículo individual publicado en el feed mientras lo "observa", en lugar de solo ver el elementos que se muestran en el feed cuando vaya a verlo. ¿Tengo eso correcto?

En lugar de proponer una solución de software completa, ¿puede usar cron u otro tipo de programación de trabajos en el servidor web con la solución que ya esté utilizando para leer los feeds y descargar su contenido?

De lo contrario, parece que terminarás cerca de volver a escribir un servicio completo como Google Reader.

1
agregado
los feeds son leídos por programas "regulares" como uTorrent, por lo que me gustaría que sea transparente para ellos. Lo que busco es esta solución "completa", sino una versión minimalista de la misma, simplemente almacenando todas las entradas nuevas y poniéndolas a disposición por un tiempo más prolongado.
agregado el autor grapefrukt, fuente

Escribir un agregador para mantener una historia más larga no debería ser demasiado difícil con una buena biblioteca de RSS.

0
agregado
No, estoy seguro de que no lo hará, solo me imagino que alguien seguramente lo habrá hecho antes y espero que haya hecho que el código esté disponible, lo que me ahorrará el problema.
agregado el autor grapefrukt, fuente
Primero: Este es un sitio de programación. Hacer esto realmente es bastante simple y da cierta flexibilidad sobre las soluciones existentes. Segundo: es bueno tener alternativas para Google.
agregado el autor iny, fuente