What Matt Mullenweg (WordPress Author) Knows About You (WordPress & Akismet Plugin User) ¿Qué Matt Mullenweg (WordPress autor) sabe acerca de usted (y WordPress plugin Akismet usuario)
I took a look at the data we are sending to Akismet, a WordPress plugin for comment spam protection, for each comment submitted on your blog, if you use this plugin for comment spam prevention. Me tomó un vistazo a los datos que estamos enviando a Akismet, un plugin para WordPress comentario protección frente a spam, para cada observación presentada en su blog, si utiliza este plugin para la prevención de los comentarios no deseados. I have recently Recientemente he started using Akismet comenzó a usar Akismet , a WordPress plugin from WordPress author , Un plugin de WordPress WordPress autor Matt Mullenweg Matt Mullenweg . I have to say I was surprised at the copious amount of data, some sensitive, being sent to Matt’s server for handling every single comment. Tengo que decir que me ha sorprendido la copiosa cantidad de datos, algunas sensibles, siendo enviado a Matt del servidor para el manejo de todos y cada uno de sus observaciones.
Tons of useless (for spam protection) information is being sent for every comment, most of which rarely, if ever, changes on a server. Toneladas de inútil (para protección frente a spam) la información se está enviando en cada comentario, la mayoría de los cuales rara vez o nunca, los cambios en un servidor.
Here are the data that was sent to Akismet server for a single test comment on my blog. Estos son los datos que se envió a Akismet servidor para una sola prueba de comentario en mi blog. I have commented on them inline. Me han comentado sobre ellos en línea.
comment_post_ID=1128 // Why does he need this? comment_post_ID = 1128 / / ¿Por qué esta necesidad?
comment_author=Angsuman+Chakraborty comment_author = + Angsuman Chakraborty
comment_author_email=angsuman%40taragana.com comment_author_email = angsuman% 40taragana.com
comment_author_url=http%3A%2F%2Fblog.taragana.com%2F comment_author_url = http% 3A% 2F% 2F% 2Fblog.taragana.com
comment_content=[Actual comment] comment_content = [Actual comentario]
comment_type= comment_type =
user_ID=1 // Why does he need this? user_ID = 1 / / ¿Por qué esta necesidad?
user_ip=59.93.245.60 user_ip = 59.93.245.60
user_agent=[Truncated] user_agent = [truncado]
referrer=[Truncated - Post url] referrer = [truncado - Post url]
blog=http%3A%2F%2Fblog.taragana.com blog = http% 3A% 2F% 2Fblog.taragana.com
CONTENT_LENGTH=98 CONTENT_LENGTH = 98
// Isn’t it obvious? / / ¿No es obvio? Why send it? ¿Por qué enviarlo? Does it ever change? ¿Nunca?
CONTENT_TYPE=application%2Fx-www-form-urlencoded CONTENT_TYPE = aplicación% 2Fx-www-form-urlencoded
// What is he doing with it? / / ¿Qué es él haciendo con él? This information is useless for spam protection. Esta información es inútil para la protección frente a spam.
DOCUMENT_ROOT=[File system path] DOCUMENT_ROOT = [sistema de archivos de ruta]
// Why does he need this? / / ¿Por qué esta necesidad? Yet another useless junk. Sin embargo, otro inútil basura.
HTTP_ACCEPT=[Truncated] HTTP_ACCEPT = [truncado]
// Why does he need this? / / ¿Por qué esta necesidad?
HTTP_ACCEPT_CHARSET=[Truncated] HTTP_ACCEPT_CHARSET = [truncado]
HTTP_ACCEPT_LANGUAGE=en-us%2Cen%3Bq%3D0.5 HTTP_ACCEPT_LANGUAGE = en-us% 2Cen% 3Bq% 3D0.5
// Why does he need this? / / ¿Por qué esta necesidad?
HTTP_CONNECTION=keep-alive HTTP_CONNECTION = mantener activa
HTTP_HOST=blog.taragana.com HTTP_HOST = blog.taragana.com
// Why does he need this? / / ¿Por qué esta necesidad?
HTTP_KEEP_ALIVE=300 HTTP_KEEP_ALIVE = 300
HTTP_REFERER=[Truncated] HTTP_REFERER = [truncado]
HTTP_USER_AGENT=[Truncated] HTTP_USER_AGENT = [truncado]
// Why does he have to have my PATH information? / / ¿Por qué él tiene que tener mi PATH información?
PATH=[PATH environment variable] PATH = [variable de entorno PATH]
REMOTE_ADDR=59.93.245.60 REMOTE_ADDR = 59.93.245.60
REMOTE_PORT=1567 REMOTE_PORT = 1567
// How many times does it change on a server? / / ¿Cuántas veces lo hace cambiar a un servidor? Why does he need it? ¿Por qué lo necesitan?
// It contains file system information / / Archivo que contiene la información del sistema
SCRIPT_FILENAME=[Truncated] SCRIPT_FILENAME = [truncado]
// How many times does it change on a server? / / ¿Cuántas veces lo hace cambiar a un servidor?
SERVER_ADDR=69.36.187.98 SERVER_ADDR = 69.36.187.98
// How many times does it change on a server? / / ¿Cuántas veces lo hace cambiar a un servidor? Why does he need it? ¿Por qué lo necesitan?
SERVER_ADMIN=Postmaster%40taragana.com SERVER_ADMIN = Postmaster% 40taragana.com
SERVER_NAME=blog.taragana.com SERVER_NAME = blog.taragana.com
// How many times does it change on a server? / / ¿Cuántas veces lo hace cambiar a un servidor? What does he need it for? ¿Qué es lo que necesitan?
SERVER_PORT=80 SERVER_PORT = 80
// How many times does it change on a server? / / ¿Cuántas veces lo hace cambiar a un servidor? What does he need it for? ¿Qué es lo que necesitan?
SERVER_SIGNATURE=[Truncated] SERVER_SIGNATURE = [truncado]
// How many times does it change on a server? / / ¿Cuántas veces lo hace cambiar a un servidor? What does he need it for? ¿Qué es lo que necesitan?
SERVER_SOFTWARE=[Truncated] SERVER_SOFTWARE = [truncado]
// How many times does it change on a server? / / ¿Cuántas veces lo hace cambiar a un servidor? What does he need it for? ¿Qué es lo que necesitan?
GATEWAY_INTERFACE=CGI%2F1.1 GATEWAY_INTERFACE = CGI% 2F1.1
// How many times does it change on a server? / / ¿Cuántas veces lo hace cambiar a un servidor? What does he need it for? ¿Qué es lo que necesitan?
SERVER_PROTOCOL=HTTP%2F1.1 SERVER_PROTOCOL = http% 2F1.1
// How many times does it change on a server? / / ¿Cuántas veces lo hace cambiar a un servidor? What does he need it for? ¿Qué es lo que necesitan?
// This is always POST! / / Esto es siempre POST!
REQUEST_METHOD=POST REQUEST_METHOD = POST
// How many times does it change on a server? / / ¿Cuántas veces lo hace cambiar a un servidor? What does he need it for? ¿Qué es lo que necesitan?
QUERY_STRING= QUERY_STRING =
// How many times does it change on a server? / / ¿Cuántas veces lo hace cambiar a un servidor? What does he need it for? ¿Qué es lo que necesitan?
REQUEST_URI=%2Fwp-comments-post.php REQUEST_URI =% 2Fwp-comments-post.php
// How many times does it change on a server? / / ¿Cuántas veces lo hace cambiar a un servidor? What does he need it for? ¿Qué es lo que necesitan?
SCRIPT_NAME=%2Fwp-comments-post.php SCRIPT_NAME =% 2Fwp-comments-post.php
// Why does he need to know where I installed WordPress on my server? / / ¿Por qué él necesita saber dónde se puede instalar WordPress en mi servidor?
PATH_TRANSLATED=[Truncated] PATH_TRANSLATED = [truncado]
// How many times does it change on a server? / / ¿Cuántas veces lo hace cambiar a un servidor? What does he need it for? ¿Qué es lo que necesitan?
PHP_SELF=%2Fwp-comments-post.php PHP_SELF =% 2Fwp-comments-post.php
// This is inane / / Este es inane
argv=Array argv = Array
// This is inane / / Este es inane
argc=0 argc = 0
This huge amount of data (considering it is send for every comment) can consume a not-so-insignificant portion of your bandwidth quota, if you get lots of spam. Esta enorme cantidad de datos (teniendo en cuenta que es enviar a cada comentario) puede consumir una no tan insignificante porción de su cuota de ancho de banda, si usted consigue un montón de spam.
It is clear Matt & Co. haven’t taken the effort to filter out the unnecessary information, even though they can easily do so. Es evidente Matt & Co no han tomado el esfuerzo de filtrar la información innecesaria, a pesar de que puede hacerlo fácilmente.
Some of these information may also be used by hackers (bad ones). Algunas de estas informaciones también puede ser utilizada por los hackers (los malos). Remember all information is submitted over the internet in cleartext. Recuerde que toda la información que se presenta a través de Internet sin formato en.
Kind of makes you feel warm and fuzzy, doesn’t it? Tipo de te hace sentir caliente y difuso, ¿no?
Filed under Filed under CMS Software CMS Software , Headline News Headline News , Pro Blogging Blogging Pro , Web , Web Services Web Services , WordPress | |
| |
RSS 2.0 RSS 2,0 | |
Trackback this Article | este artículo |
Email this Article Enviar artículo
You may also like to read También puede leer |




April 8th, 2006 at 11:03 pm Abril 8, 2006 a las 11:03 pm
Akismet’s privacy policy is available to the public here (legal translation coming soon): Akismet la política de privacidad está a disposición del público aquí (traducción jurídica a venir):
http://akismet.com/privacy/
Matt would [probably] be glad if you were to contact him with your privacy/security concerns. Matt se [probablemente] se alegra si estuviera en contacto con él para con su privacidad y seguridad se refiere. If you send your inquiry through Si envía su solicitud a través de the Akismet contact form Akismet el formulario de contacto , he’ll usually respond within the week. , Él va a responder por lo general dentro de la semana.
April 9th, 2006 at 6:00 pm 9 de abril de 2006, a las 6:00 pm
We do strip out potentially sensitive data, like your login cookie. Aunque hacemos todo lo tira a datos potencialmente delicados, al igual que su cookie. The rest is entirely harmless, and actually quite useful in identifying spam. El resto es totalmente inofensivo, y en realidad muy útil en la identificación de spam. You can exclude it, but the effectiveness of Akismet will go down. Usted puede excluir, pero la eficacia de Akismet pasará.
April 10th, 2006 at 9:36 am 10 de abril de 2006, a las 9:36 am
Matt,
Thanks for the clarifications. Gracias por las aclaraciones. However I couldn’t understand why you need data which never changes for any user like: Sin embargo yo no podía entender por qué necesita los datos que nunca cambia para cualquier usuario como:
CONTENT_TYPE=application%2Fx-www-form-urlencoded CONTENT_TYPE = aplicación% 2Fx-www-form-urlencoded
REQUEST_METHOD=POST REQUEST_METHOD = POST
SERVER_PORT=80 // May very rarely change SERVER_PORT = 80 / / mayo muy rara vez cambio
SERVER_PROTOCOL=HTTP%2F1.1 SERVER_PROTOCOL = http% 2F1.1
GATEWAY_INTERFACE=CGI%2F1.1 GATEWAY_INTERFACE = CGI% 2F1.1
etc. etc
Also there are several pieces of data which I cannot see (irrespective of the algorithm you are using, which I personally think is a variant of naive bayesian with manual blacklisting También hay varios fragmentos de datos que no puedo ver (con independencia del algoritmo que utiliza, que yo, personalmente, cree que es una variante de bayesian ingenuo con el manual de listas negras
) how they can help in analysing spam like my servers SCRIPT_FILENAME or PATH_TRANSLATED. ) Cómo pueden ayudar en el análisis de spam al igual que mis servidores SCRIPT_FILENAME o PATH_TRANSLATED.
I could see you have a provision in code to filter out certain data from list. Pude ver que haya una disposición en el código para filtrar determinados datos de la lista. Why not use it to get only the data that you need. ¿Por qué no utilizarlo para obtener sólo los datos que usted necesita.
Looking forward to your response. Esperamos su respuesta.
Best, Mejor,
Angsuman
April 10th, 2006 at 9:37 am 10 de abril de 2006, a las 9:37 am
James,
I guess I reached him faster this way Supongo que me llegó a él más rápido de esta manera
Thanks for your suggestions. Gracias por tus sugerencias.
Best, Mejor,
Angsuman
April 11th, 2006 at 12:14 pm 11 de abril de 2006, a las 12:14 pm
[...] In addition, over at Simple Thoughts, Angsuman Chakraborty wrote an interesting post entitled, “What Matt Mullenweg (WordPress Author) Knows About You (WordPress & Akismet Plugin User).” There, he figured out what kind of info Akismet sends back to interpret comments as spam / not spam. [...] Además, a lo largo de los pensamientos simples, Angsuman Chakraborty escribió un interesante post titulado, "¿Qué Matt Mullenweg (WordPress Autor) Sabe Usted Acerca de (WordPress plugin Akismet y usuario)." Allí, de pruebas, qué tipo de información Akismet envía de nuevo a interpretar los comentarios como spam y no spam. All this was very interesting, but it got my no further to my goal of getting out of Akismet jail. Todo esto fue muy interesante, pero no obtuve mi más a mi meta de salir de la cárcel Akismet. My identity had been taken by a black box for unknown reasons, and there was no way to get it back. Mi identidad ha sido adoptada por un recuadro negro por razones desconocidas, y no había manera de volver. Granted, on the net it is very easy to change your identity, but I had been writing as myself for quite awhile. Por supuesto, en la red es muy fácil para cambiar su identidad, pero yo había escrito para mí mismo como un tiempo bastante. Why would I want to give up what little, if any, reputation I have? ¿Por qué iba a querer renunciar a lo poco, en su caso, la reputación tengo? Especially to the black box? Especialmente para el cuadro negro? [...]
January 16th, 2007 at 8:47 am 16 de enero de 2007, a las 8:47 am
I my - maybe simple - views these informations are required for analyzing spam: Yo mi - tal vez simple - considera que estas informaciones son necesarias para el análisis de spam:
comment_content # Yeah, sure… comment_content # Sí, seguro…
comment_author* # All three together comment_author * # Los tres juntos
blog_url (a splogger can easily remove that URL, so you still have his server’s IP number. But what about a sblog like spammer-blog.wordpress.com? Got it? IP is useless, two! blog_url (a splogger puede eliminar fácilmente dicha URL, por lo que todavía tienen su servidor del número IP. Pero ¿qué pasa con un sblog como spammer-blog.wordpress.com? Got? IP es inútil, dos!
And even the client’s IP/user-agent-string are useless because of open proxies. E incluso del cliente IP / user-agent-string son inútiles porque de proxies abiertos. Yeah, you can blacklist that IP numbers, but how many open proxies exist in the wide world? Sí, puede que la lista negra los números de IP, pero el número de proxies abiertos existen en el ancho mundo? 100,000 ??? 100.000?
Well, I’ll remove all information which you really don’t need to know from my blog (like absolute paths and such). Bueno, voy a quitar toda la información que usted realmente no necesita saber de mi blog (como rutas absolutas y tal). Only I need to know where your scripts are installed and not you. Sólo necesito saber dónde sus escrituras están instalados y no a usted.
I know you can blacklist my ID number so move on. Yo sé que ustedes pueden "lista negra" de mi número de identificación a fin de pasar. I have more anti-spam plug-ins left to replace with Akismet. Tengo más anti-spam plug-ins para reemplazar a la izquierda con Akismet.
And Akismet isn’t the ultimate death for spam comments, as well. Akismet y no es el final de muerte para los comentarios spam, también.
I’m not against Matt and all the other people behind Akismet but I really need to know why, why, why you need to know so much useless informations from my blog? No estoy en contra de Matt y todas las otras personas detrás de Akismet pero realmente necesitamos saber por qué, por qué, por qué lo que necesita saber tanto la información inútil de mi blog? Why the comment ID why the absolute path of my script installation? ¿Por qué la observación de identificación por qué la ruta absoluta de mi script de instalación?
So long and all the best, En tanto y todo lo mejor,
Roland
January 16th, 2007 at 8:50 am 16 de enero de 2007, a las 8:50 am
An addition to my previous post. Una adición a mi post anterior. I’m saying this to Matt not to Angsuman. Estoy diciendo que esto no a Matt Angsuman.
August 1st, 2007 at 5:53 pm Del 1 de agosto de 2007, a las 5:53 pm
Don’t forget that Akismet is integrated into other tools too, such as the cakePHP framework so some of that info will be relevant there. No hay que olvidar que Akismet se integra en otras herramientas también, como el CakePHP marco para que algunos de esa información será relevante.
I’m with you on the server path type of thing but the actual calling script is probably important for identifying the weak points (or high traffic points ) on a site. Estoy con usted en la ruta del servidor tipo de cosas aunque en realidad las llamadas script es probablemente importante para identificar los puntos débiles (o puntos de alto tráfico) en un sitio. More for future development than current spam detection. Más para el desarrollo futuro de la detección de spam actuales.
I wouldn’t be blogging today if it wasn’t for Akismet and Bad Behaviour - as it is I have all comments on moderation anyway… it’s that bad! Yo no estaría hoy blogs si no fuera por Akismet y mala conducta - como es tengo todos los comentarios sobre la moderación de todas maneras… es tan malo!