My analysis of the actual problem with JavaBlogs Aggregator Mi análisis del problema real con JavaBlogs Aggregator

Disclaimer Renuncia
This analysis is based on observing Este análisis se basa en la observación my blog mi blog ’s interaction with 'S interacción con JavaBlogs . JavaBlogs as you know is a popular aggregator for Java feeds. JavaBlogs como ustedes saben es un agregador de feeds para Java.
Overview Descripción general
Often many of us see that A menudo, muchos de nosotros ver que old posts of our blog keeps popping up in JavaBlogs antiguas de nuestro blog mantiene saltan a JavaBlogs .
Details Detalles
RSS versions before 2.0 did not have GUID. RSS versiones anteriores a 2,0 no tienen GUID. So preventing duplicate posts is slightly harder then RSS 2.0 compliant feeds. Por lo tanto, prevenir la duplicación de puestos es un poco difícil entonces compatible con RSS feeds 2,0. My feed Mi alimentación is es RSS 2.0 RSS 2,0 compliant. obediente. Specifically it sends a Concretamente, envía un GUID as an element of como un elemento de item artículo . GUID is supposed to be globally unique. GUID se supone que es única a escala mundial. So if I change my feed url but keep my GUID same it shouldn’t matter. Por lo tanto, si cambiar mi url, pero pienso mantener mi mismo GUID no debería asunto.
What does WordPress send as GUID? ¿Qué significa enviar WordPress como GUID? It sends the permalink to the post as GUID like Se envía el permalink para ocupar el cargo como GUID como http://blog.taragana.com/index.php/archive/whats-up-with-republican-java-geeks/ .
Technically they are globally unique. Técnicamente son únicas a nivel mundial. Unless I change my site structure. A menos que cambiar mi estructura del sitio. So if I start using .htaccess and change the permalink format to Por lo tanto, si yo empiezo a usar. Htaccess y cambiar el formato para perm http://blog.taragana.com/archive/whats-up-with-republican-java-geeks/ then I can expect reposting to happen, right? entonces no puedo esperar reposting a suceder, ¿verdad? Yes, it does happen in JavaBlogs and it has happened to me once or twice. Sí, sí sucederá en JavaBlogs y lo que ha sucedido a mí una vez o dos veces. However it can still be prevented. Sin embargo, todavía puede evitarse. More on it in a later post. Más al respecto en un futuro post.
In any case WordPress can also improve this situation by using a alpha-numeric GUID value instead of permalinks, which may not be so permanent after all. En cualquier caso WordPress también puede mejorar esta situación mediante la utilización de un alfa-numérico valor GUID en lugar de permalinks, que no podrá ser de manera permanente, después de todo.
The more common problem is something much simpler. El problema más común es algo mucho más sencillo. Suppose you normally syndicate 20 latest items from your feed. Supongamos que usted normalmente sindicato más tardar 20 temas de su feed. Then you suddenly decide to syndicate more say 30. Entonces de repente deciden sindicato más decir 30. Now suddenly lot of the old feeds are republished again! Ahora, de repente, muchos de los antiguos canales son a publicar de nuevo! The GUID hasn’t changed nor the date, only the item count has changed in the feed. El GUID no ha cambiado ni la fecha, sólo contar el tema ha cambiado en los piensos. Probably the reverse (reducing the number of items in a feed) is also true, cannot remember for sure. Probablemente, a la inversa (la reducción del número de elementos de una alimentación) también es cierto, no puede recordar con certeza.
It appears Al parecer, JavaBlogs is maintaining a database of past feed items JavaBlogs es mantener una base de datos de los últimos artículos de alimentación . So it shouldn’t be hard to identify that the post is not new. Por lo tanto, no debería ser difícil de identificar que el puesto no es nuevo.
It looks like some simple bug. Parece que algunos simple error. Hopefully it will be fixed soon. Es de esperar que se fijará en breve.
This article was initiated by a comment from Este artículo fue iniciado por un comentario de Mr. Charles Miller, developer at JavaBlogs Señor Charles Miller, creador a JavaBlogs .
PS. On a different note I think the policy to display a feed when its date has been updated is correct implementation by JavaBlogs. En una nota diferente Creo que la política para mostrar un feed cuando la fecha se ha actualizado es correcta aplicación de JavaBlogs.
Filed under Filed under Java Software El software de Java , Pro Blogging Blogging Pro , Technology Tecnología , Web , WordPress | |
| |
RSS 2.0 RSS 2,0 | |
Email this Article Enviar artículo
You may also like to read También puede leer |





March 18th, 2005 at 2:19 am 18 de marzo de 2005, a las 2:19 am
Tracking duplicates is a nightmare with all the various RSS flavors and buggy RSS feeds out there. Seguimiento de duplicados es una pesadilla con todos los distintos sabores y RSS feeds RSS buggy fuera allí. My code for javacrawl.com currently does the following query to check for a duplicate post: “…where (guid = ? OR (link = ? and title = ?))”. Mi código de javacrawl.com actualmente hace la siguiente consulta para ver si hay un duplicado después: "… donde (GUID =? Oregón (link =? Y title = ?))". This works reasonably well, but is still succeptable to the changing link problem you mention here. Esto funciona razonablemente bien, pero es todavía succeptable a la evolución de enlace problema que usted menciona aquí.
I agree that using links for GUID is probably not the best unless they’re stable. Estoy de acuerdo en que el uso de enlaces para GUID probablemente no es el mejor a menos que estén estables. An MD5 hash of the title plus the timestamp would be a reasonable way to go. Un hash MD5 del título más la fecha y hora sería un razonable camino por recorrer.
Another suggestion I would have to RSS producers is to please, please implement responding 304 to the If-Modified-Since header. Otra sugerencia que tendría que RSS es a los productores por favor, por favor, poner en práctica en respuesta a las 304 If-Modified-Since encabezado. This saves a huge amount of CPU, disk and bandwith resources on both ends. Esto ahorra una gran cantidad de CPU, disco y recursos de ancho de banda en ambos extremos.
March 18th, 2005 at 2:56 am 18 de marzo de 2005, a las 2:56 am
Jason,
Thanks for the informative comments. Gracias por los comentarios informativos.
The MD5 of title and timestamp sounds good, I cannot think of anything against it. El MD5 de título y fecha y hora suena bien, no puedo pensar en nada en contra.
304 would be good solution to reduce the bandwidth clog and will ultimately benefit the bloggers. 304 sería una buena solución para reducir el ancho de banda y tapar en última instancia, beneficiará a los usuarios de Blogger.
April 3rd, 2005 at 8:09 pm 3 de Abril, 2005 a las 8:09 pm
It’s not just a problem with JavaBlogs! No es sólo un problema con JavaBlogs!
Everytime I ping Technorati that my blog has been updated, it takes every entry previously and spams the Technorati tags (ie Java tag) as well! Cada vez me Technorati ping que mi blog ha sido actualizado, toma cada entrada con anterioridad y los spams Technorati tags (es decir, Java etiqueta), como así! I do use RSS 2.0 and Rome 0.5 from Sun Microsystems to generate my own feeds, and I do use the and tags. Hacer uso de RSS 2,0 y 0,5 Roma de Sun Microsystems para crear mis propios alimentos, y hacer uso y las etiquetas. I have used the permalink system, but since I can put anything in there since I control the code, maybe I’ll start generating my own MD5 hash as suggested. He utilizado el sistema de permalink, pero desde que me puede poner algo allí, ya que el código de control, tal vez voy a empezar a generar mis propios hash MD5 como se sugiere. If anyone wants to know if that works, check out my website in about a week. Si alguien quiere saber si esto funciona, echa un vistazo a mi sitio web en aproximadamente una semana.
Otherwise, enjoy reading my entries from March 2005 for the ninteith time. De lo contrario, disfrutar de mi lectura de las entradas a partir de marzo de 2005, relativo a la ninteith tiempo.