What Matt Mullenweg (WordPress Author) Knows About You (WordPress & Akismet Plugin User) Que Matt Mullenweg (wordpress auteur) sait qui vous concernent (wordpress plugin Akismet et utilisateur)
I took a look at the data we are sending to Akismet, a WordPress plugin for comment spam protection, for each comment submitted on your blog, if you use this plugin for comment spam prevention. J'ai pris un coup d'œil les données que nous envoyons à Akismet, un plugin pour WordPress commentaire de protection contre les spams, pour chaque commentaire soumis dans votre blog, si vous utiliser ce plugin pour les commentaires indésirables prévention. I have recently J'ai récemment started using Akismet commencé à utiliser Akismet , a WordPress plugin from WordPress author , Un plugin de WordPress WordPress auteur Matt Mullenweg Matt Mullenweg . I have to say I was surprised at the copious amount of data, some sensitive, being sent to Matt’s server for handling every single comment. Je dois dire que j'ai été surpris par l'abondante quantité de données, certains sensibles, d'être envoyés à Matt le serveur pour traiter chaque commentaire.
Tons of useless (for spam protection) information is being sent for every comment, most of which rarely, if ever, changes on a server. Inutile de tonnes (pour une protection contre le spam) des informations est envoyé pour chaque commentaire, dont la plupart sont rarement, sinon jamais, les changements sur un serveur.
Here are the data that was sent to Akismet server for a single test comment on my blog. Voici les données qui ont été envoyés à Akismet serveur pour un test unique commentaire sur mon blog. I have commented on them inline. J'ai des commentaires sur leur ligne.
comment_post_ID=1128 // Why does he need this? comment_post_ID = 1128 / / Pourquoi doit-il cela?
comment_author=Angsuman+Chakraborty comment_author = + Angsuman Chakraborty
comment_author_email=angsuman%40taragana.com comment_author_email = angsuman% 40taragana.com
comment_author_url=http%3A%2F%2Fblog.taragana.com%2F comment_author_url = http% 3A% 2F% 2F% 2Fblog.taragana.com
comment_content=[Actual comment] comment_content = [effectif commentaire]
comment_type= comment_type =
user_ID=1 // Why does he need this? user_ID = 1 / / Pourquoi doit-il cela?
user_ip=59.93.245.60 user_ip = 59.93.245.60
user_agent=[Truncated] user_agent = [tronqué]
referrer=[Truncated - Post url] referrer = [tronqué - Post url]
blog=http%3A%2F%2Fblog.taragana.com blog = http% 3A% 2F% 2Fblog.taragana.com
CONTENT_LENGTH=98 CONTENT_LENGTH = 98
// Isn’t it obvious? / / N'est-il pas évident? Why send it? Pourquoi l'envoyer? Does it ever change? T-il peut-il changer?
CONTENT_TYPE=application%2Fx-www-form-urlencoded CONTENT_TYPE = application% 2Fx-www-form-urlencoded
// What is he doing with it? / / Qu'est-il faire avec elle? This information is useless for spam protection. Cette information est inutile pour une protection contre le spam.
DOCUMENT_ROOT=[File system path] DOCUMENT_ROOT = [Système de fichiers chemin]
// Why does he need this? / / Pourquoi doit-il cela? Yet another useless junk. Pourtant, un autre inutile de rebus.
HTTP_ACCEPT=[Truncated] HTTP_ACCEPT = [tronqué]
// Why does he need this? / / Pourquoi doit-il cela?
HTTP_ACCEPT_CHARSET=[Truncated] HTTP_ACCEPT_CHARSET = [tronqué]
HTTP_ACCEPT_LANGUAGE=en-us%2Cen%3Bq%3D0.5 HTTP_ACCEPT_LANGUAGE = en-us% 2Cen% 3Bq% 3D0.5
// Why does he need this? / / Pourquoi doit-il cela?
HTTP_CONNECTION=keep-alive HTTP_CONNECTION = keep-alive
HTTP_HOST=blog.taragana.com HTTP_HOST = blog.taragana.com
// Why does he need this? / / Pourquoi doit-il cela?
HTTP_KEEP_ALIVE=300 HTTP_KEEP_ALIVE = 300
HTTP_REFERER=[Truncated] HTTP_REFERER = [tronqué]
HTTP_USER_AGENT=[Truncated] HTTP_USER_AGENT = [tronqué]
// Why does he have to have my PATH information? / / Pourquoi at-il à ce que mon chemin?
PATH=[PATH environment variable] PATH = [variable d'environnement PATH]
REMOTE_ADDR=59.93.245.60 REMOTE_ADDR = 59.93.245.60
REMOTE_PORT=1567 REMOTE_PORT = 1567
// How many times does it change on a server? / / Combien de fois faut-il changer sur un serveur? Why does he need it? Pourquoi at-il besoin?
// It contains file system information / / Il contient des informations sur le système de fichiers
SCRIPT_FILENAME=[Truncated] SCRIPT_FILENAME = [tronqué]
// How many times does it change on a server? / / Combien de fois faut-il changer sur un serveur?
SERVER_ADDR=69.36.187.98 Server_addr = 69.36.187.98
// How many times does it change on a server? / / Combien de fois faut-il changer sur un serveur? Why does he need it? Pourquoi at-il besoin?
SERVER_ADMIN=Postmaster%40taragana.com SERVER_ADMIN = poste% 40taragana.com
SERVER_NAME=blog.taragana.com SERVER_NAME = blog.taragana.com
// How many times does it change on a server? / / Combien de fois faut-il changer sur un serveur? What does he need it for? Que fait-il besoin?
SERVER_PORT=80 Server_port = 80
// How many times does it change on a server? / / Combien de fois faut-il changer sur un serveur? What does he need it for? Que fait-il besoin?
SERVER_SIGNATURE=[Truncated] SERVER_SIGNATURE = [tronqué]
// How many times does it change on a server? / / Combien de fois faut-il changer sur un serveur? What does he need it for? Que fait-il besoin?
SERVER_SOFTWARE=[Truncated] SERVER_SOFTWARE = [tronqué]
// How many times does it change on a server? / / Combien de fois faut-il changer sur un serveur? What does he need it for? Que fait-il besoin?
GATEWAY_INTERFACE=CGI%2F1.1 CGI GATEWAY_INTERFACE =% 2F1.1
// How many times does it change on a server? / / Combien de fois faut-il changer sur un serveur? What does he need it for? Que fait-il besoin?
SERVER_PROTOCOL=HTTP%2F1.1 SERVER_PROTOCOL = http% 2F1.1
// How many times does it change on a server? / / Combien de fois faut-il changer sur un serveur? What does he need it for? Que fait-il besoin?
// This is always POST! / / C'est toujours POSTE!
REQUEST_METHOD=POST REQUEST_METHOD = POST
// How many times does it change on a server? / / Combien de fois faut-il changer sur un serveur? What does he need it for? Que fait-il besoin?
QUERY_STRING= QUERY_STRING =
// How many times does it change on a server? / / Combien de fois faut-il changer sur un serveur? What does he need it for? Que fait-il besoin?
REQUEST_URI=%2Fwp-comments-post.php REQUEST_URI =% 2Fwp-comments-post.php
// How many times does it change on a server? / / Combien de fois faut-il changer sur un serveur? What does he need it for? Que fait-il besoin?
SCRIPT_NAME=%2Fwp-comments-post.php SCRIPT_NAME =% 2Fwp-comments-post.php
// Why does he need to know where I installed WordPress on my server? / / Pourquoi at-il besoin de savoir où j'ai installé WordPress sur mon serveur?
PATH_TRANSLATED=[Truncated] PATH_TRANSLATED = [tronqué]
// How many times does it change on a server? / / Combien de fois faut-il changer sur un serveur? What does he need it for? Que fait-il besoin?
PHP_SELF=%2Fwp-comments-post.php PHP_SELF =% 2Fwp-comments-post.php
// This is inane / / C'est inane
argv=Array argv = Array
// This is inane / / C'est inane
argc=0 argc = 0
This huge amount of data (considering it is send for every comment) can consume a not-so-insignificant portion of your bandwidth quota, if you get lots of spam. Cette énorme quantité de données (en considérant qu'il est envoyé pour chaque commentaire) peut consommer un peu moins insignifiante partie de votre quota de bande passante, si vous recevez beaucoup de spam.
It is clear Matt & Co. haven’t taken the effort to filter out the unnecessary information, even though they can easily do so. Il est clair Matt & Co. n'ont pas pris l'effort de filtrer les informations inutiles, même si elles peuvent facilement le faire.
Some of these information may also be used by hackers (bad ones). Certains de ces informations mai également être utilisés par les pirates (mauvais). Remember all information is submitted over the internet in cleartext. Rappelez-vous toutes les informations est présenté en clair sur Internet.
Kind of makes you feel warm and fuzzy, doesn’t it? Type de vous donne l'impression chaleureuse et floue, n'est-ce pas?
Filed under Classé sous CMS Software Logiciel de CMS , Headline News Headline News , Pro Blogging Blogging Pro , Web , Web Services Services Web , WordPress | |
| |
RSS 2.0 RSS 2,0 | |
Trackback this Article | cet article |
Email this Article Envoyer cet article
You may also like to read Vous mai également à lire |




April 8th, 2006 at 11:03 pm Le 8 avril 2006 à 11:03 pm
Akismet’s privacy policy is available to the public here (legal translation coming soon): Akismet la politique de confidentialité est à la disposition du public ici (traduction juridique à venir):
http://akismet.com/privacy/
Matt would [probably] be glad if you were to contact him with your privacy/security concerns. Matt aurait [probablement] être heureux si vous étiez à prendre contact avec lui votre vie privée / sécurité. If you send your inquiry through Si vous envoyez votre demande par the Akismet contact form Akismet le formulaire de contact , he’ll usually respond within the week. , Il vous répondons généralement dans la semaine.
April 9th, 2006 at 6:00 pm Avril 9th, 2006 at 6:00 pm
We do strip out potentially sensitive data, like your login cookie. Nous faisons bande à des données potentiellement sensibles, comme votre cookie. The rest is entirely harmless, and actually quite useful in identifying spam. Le reste est entièrement sans danger, et, en fait, très utile pour identifier le spam. You can exclude it, but the effectiveness of Akismet will go down. Vous pouvez l'exclure, mais l'efficacité de Akismet restera.
April 10th, 2006 at 9:36 am Avril 10th, 2006 at 9:36 am
Matt,
Thanks for the clarifications. Merci pour les précisions. However I couldn’t understand why you need data which never changes for any user like: Mais je ne pouvais pas comprendre pourquoi vous avez besoin de données qui ne change jamais pour un utilisateur comme:
CONTENT_TYPE=application%2Fx-www-form-urlencoded CONTENT_TYPE = application% 2Fx-www-form-urlencoded
REQUEST_METHOD=POST REQUEST_METHOD = POST
SERVER_PORT=80 // May very rarely change Server_port = 80 / / Mai changement très rarement
SERVER_PROTOCOL=HTTP%2F1.1 SERVER_PROTOCOL = http% 2F1.1
GATEWAY_INTERFACE=CGI%2F1.1 CGI GATEWAY_INTERFACE =% 2F1.1
etc. etc
Also there are several pieces of data which I cannot see (irrespective of the algorithm you are using, which I personally think is a variant of naive bayesian with manual blacklisting En plus, il ya plusieurs éléments d'information que je ne vois pas (indépendamment de l'algorithme que vous utilisez, que je pense personnellement est une variante de bayésien naïf manuel avec une liste noire
) how they can help in analysing spam like my servers SCRIPT_FILENAME or PATH_TRANSLATED. ) Comment ils peuvent aider à analyser le spam comme mes serveurs ou SCRIPT_FILENAME PATH_TRANSLATED.
I could see you have a provision in code to filter out certain data from list. Je pourrais voir que vous avez une disposition dans le code de filtrer certaines données de la liste. Why not use it to get only the data that you need. Pourquoi ne pas l'utiliser pour obtenir que les données dont vous avez besoin.
Looking forward to your response. Dans l'attente de votre réponse.
Best, Meilleur,
Angsuman
April 10th, 2006 at 9:37 am Avril 10th, 2006 at 9:37 am
James,
I guess I reached him faster this way Je suppose que je lui est parvenue plus rapidement de cette façon
Thanks for your suggestions. Merci pour vos suggestions.
Best, Meilleur,
Angsuman
April 11th, 2006 at 12:14 pm Avril 11, 2006 at 12:14 pm
[...] In addition, over at Simple Thoughts, Angsuman Chakraborty wrote an interesting post entitled, “What Matt Mullenweg (WordPress Author) Knows About You (WordPress & Akismet Plugin User).” There, he figured out what kind of info Akismet sends back to interpret comments as spam / not spam. [...] En outre, plus simple à Pensées, Angsuman Chakraborty a écrit un intéressant post intitulé «Qu'est-ce Matt Mullenweg (WordPress Auteur) Knows About You (WordPress et Akismet Plugin Utilisateur)." Là, il a compris ce genre d'info Akismet renvoie à interpréter les commentaires comme spam / non spam. All this was very interesting, but it got my no further to my goal of getting out of Akismet jail. Tout cela était très intéressant, mais il obtenu mon pas d'autres à mon objectif de sortir de prison Akismet. My identity had been taken by a black box for unknown reasons, and there was no way to get it back. Mon identité a été prise par une boîte noire pour des raisons inconnues, et il n'y avait aucun moyen de récupérer. Granted, on the net it is very easy to change your identity, but I had been writing as myself for quite awhile. Certes, sur le net, il est très facile de changer votre identité, mais j'avais été écrit pour moi-même tout à fait un certain temps. Why would I want to give up what little, if any, reputation I have? Pourquoi voudrais-je renoncer à ce que peu, le cas échéant, la réputation-je avoir? Especially to the black box? En particulier à la boîte noire? [...]
January 16th, 2007 at 8:47 am Janvier 16th, 2007 at 8:47 am
I my - maybe simple - views these informations are required for analyzing spam: Je my - peut-être simple - considère que ces informations sont nécessaires pour l'analyse de spam:
comment_content # Yeah, sure… comment_content # Ouais, bien sûr…
comment_author* # All three together comment_author * # Tous les trois en même temps
blog_url (a splogger can easily remove that URL, so you still have his server’s IP number. But what about a sblog like spammer-blog.wordpress.com? Got it? IP is useless, two! blog_url (un splogger pouvez facilement supprimer cette URL, si vous avez encore du serveur de son numéro IP. Mais qu'en est-il de sblog comme un spammeur-blog.wordpress.com? Got it? IP est inutile, deux!
And even the client’s IP/user-agent-string are useless because of open proxies. Et même du client IP / user-agent string sont inutiles en raison de proxy ouverts. Yeah, you can blacklist that IP numbers, but how many open proxies exist in the wide world? Oui, vous pouvez liste noire que les numéros IP, mais combien de proxy ouverts existent dans le monde? 100,000 ??? 100.000?
Well, I’ll remove all information which you really don’t need to know from my blog (like absolute paths and such). Eh bien, je vais enlever toutes les informations dont vous avez vraiment pas besoin de savoir de mon blog (comme des chemins absolus, etc). Only I need to know where your scripts are installed and not you. J'ai seulement besoin de savoir où vos scripts sont installés et pas vous.
I know you can blacklist my ID number so move on. Je sais que vous pouvez liste noire mon numéro d'identification de sorte aller de l'avant. I have more anti-spam plug-ins left to replace with Akismet. J'ai d'autres anti-spam plug-ins gauche à remplacer par Akismet.
And Akismet isn’t the ultimate death for spam comments, as well. Et Akismet n'est pas la mort pour ultime spam commentaires ainsi.
I’m not against Matt and all the other people behind Akismet but I really need to know why, why, why you need to know so much useless informations from my blog? Je ne suis pas contre Matt et tous les autres gens derrière Akismet mais je vraiment besoin de savoir pourquoi, pourquoi, pourquoi vous avez besoin de savoir si beaucoup d'informations inutiles de mon blog? Why the comment ID why the absolute path of my script installation? Pourquoi le commentaire ID pourquoi le chemin absolu de mon script d'installation?
So long and all the best, Tant et tous les meilleurs,
Roland
January 16th, 2007 at 8:50 am Janvier 16th, 2007 chez 8:50 am
An addition to my previous post. Un ajout à mon précédent poste. I’m saying this to Matt not to Angsuman. Je dis que ce à Matt de ne pas Angsuman.
August 1st, 2007 at 5:53 pm Le 1er août 2007 à 5:53 pm
Don’t forget that Akismet is integrated into other tools too, such as the cakePHP framework so some of that info will be relevant there. Ne pas oublier que Akismet est intégré dans d'autres outils sont également présents, tels que le cadre cakephp certaines de ces informations seront utiles.
I’m with you on the server path type of thing but the actual calling script is probably important for identifying the weak points (or high traffic points ) on a site. Je suis avec vous sur le chemin du serveur genre de choses mais le script appelant est probablement important pour identifier les points faibles (ou fort trafic points) sur un site. More for future development than current spam detection. Plus d'avenir pour le développement actuel que la détection de spam.
I wouldn’t be blogging today if it wasn’t for Akismet and Bad Behaviour - as it is I have all comments on moderation anyway… it’s that bad! Je ne serais pas blogging aujourd'hui si ce n'était pas pour Akismet et mauvais comportement - comme il est, j'ai tous les commentaires sur la modération de toute façon… il est si mal!