What Matt Mullenweg (WordPress Author) Knows About You (WordPress & Akismet Plugin User) O que Matt Mullenweg (WordPress autor) Quem sabe você (wordpress plugin Akismet & usuário)
I took a look at the data we are sending to Akismet, a WordPress plugin for comment spam protection, for each comment submitted on your blog, if you use this plugin for comment spam prevention. Eu levei um olhar para os dados que estamos enviando para Akismet, um plugin para WordPress comentário spam proteção, para cada comentário apresentado em seu blog, se você usar este plugin para comentar spam prevenção. I have recently Tenho recentemente started using Akismet começou a utilizar o Akismet , a WordPress plugin from WordPress author , Um plugin de WordPress WordPress autor Matt Mullenweg Matt Mullenweg . I have to say I was surprised at the copious amount of data, some sensitive, being sent to Matt’s server for handling every single comment. Tenho de dizer que fiquei surpreendido com a copiosa quantidade de dados, alguns sensíveis, sendo enviado para Matt's servidor para cada única movimentação comentário.
Tons of useless (for spam protection) information is being sent for every comment, most of which rarely, if ever, changes on a server. Toneladas de inúteis (spam de protecção) informação está a ser enviada para cada comentário, a maioria dos quais raramente, ou nunca, as mudanças em um servidor.
Here are the data that was sent to Akismet server for a single test comment on my blog. Aqui estão os dados que foram enviados para Akismet servidor para um único teste comentário no meu blog. I have commented on them inline. Tenho comentado sobre eles inline.
comment_post_ID=1128 // Why does he need this? comment_post_ID = 1128 / / Porque é que ele precisa disso?
comment_author=Angsuman+Chakraborty comment_author = + Angsuman Chakraborty
comment_author_email=angsuman%40taragana.com comment_author_email = angsuman% 40taragana.com
comment_author_url=http%3A%2F%2Fblog.taragana.com%2F comment_author_url = http% 3A% 2F% 2F% 2Fblog.taragana.com
comment_content=[Actual comment] comment_content = [real comentário]
comment_type= comment_type =
user_ID=1 // Why does he need this? user_ID = 1 / / Porque é que ele precisa disso?
user_ip=59.93.245.60 user_ip = 59.93.245.60
user_agent=[Truncated] user_agent = [truncado]
referrer=[Truncated - Post url] referrer = [Truncado - Post url]
blog=http%3A%2F%2Fblog.taragana.com blog = http% 3A% 2F% 2Fblog.taragana.com
CONTENT_LENGTH=98 CONTENT_LENGTH = 98
// Isn’t it obvious? / / Não é óbvio? Why send it? Por que enviá-lo? Does it ever change? Será que alguma vez mudar?
CONTENT_TYPE=application%2Fx-www-form-urlencoded CONTENT_TYPE = candidatura% 2Fx-www-form-urlencoded
// What is he doing with it? / / O que ele está fazendo com ele? This information is useless for spam protection. Esta informação é inútil para a protecção spam.
DOCUMENT_ROOT=[File system path] DOCUMENT_ROOT = [sistema de arquivos via]
// Why does he need this? / / Por que é que ele precisa disso? Yet another useless junk. Ainda outra inútil lixo.
HTTP_ACCEPT=[Truncated] HTTP_ACCEPT = [truncado]
// Why does he need this? / / Por que é que ele precisa disso?
HTTP_ACCEPT_CHARSET=[Truncated] HTTP_ACCEPT_CHARSET = [truncado]
HTTP_ACCEPT_LANGUAGE=en-us%2Cen%3Bq%3D0.5 HTTP_ACCEPT_LANGUAGE = en-us% 2Cen% 3Bq% 3D0.5
// Why does he need this? / / Por que é que ele precisa disso?
HTTP_CONNECTION=keep-alive HTTP_CONNECTION = manter viva -
HTTP_HOST=blog.taragana.com HTTP_HOST = blog.taragana.com
// Why does he need this? / / Por que é que ele precisa disso?
HTTP_KEEP_ALIVE=300 HTTP_KEEP_ALIVE = 300
HTTP_REFERER=[Truncated] HTTP_REFERER = [truncado]
HTTP_USER_AGENT=[Truncated] HTTP_USER_AGENT = [truncado]
// Why does he have to have my PATH information? / / Por que é que ele tem de ter o meu PATH informação?
PATH=[PATH environment variable] PATH = [variável de ambiente PATH]
REMOTE_ADDR=59.93.245.60 REMOTE_ADDR = 59.93.245.60
REMOTE_PORT=1567 REMOTE_PORT = 1567
// How many times does it change on a server? / / Quantas vezes não se alterar em um servidor? Why does he need it? Porque é que ele precisa disso?
// It contains file system information / / O sistema de arquivos contém informações
SCRIPT_FILENAME=[Truncated] SCRIPT_FILENAME = [truncado]
// How many times does it change on a server? / / Quantas vezes não se alterar em um servidor?
SERVER_ADDR=69.36.187.98 SERVER_ADDR = 69.36.187.98
// How many times does it change on a server? / / Quantas vezes não se alterar em um servidor? Why does he need it? Porque é que ele precisa disso?
SERVER_ADMIN=Postmaster%40taragana.com SERVER_ADMIN = Postmaster% 40taragana.com
SERVER_NAME=blog.taragana.com = Server_name blog.taragana.com
// How many times does it change on a server? / / Quantas vezes não se alterar em um servidor? What does he need it for? O que ele precisa dele para?
SERVER_PORT=80 SERVER_PORT = 80
// How many times does it change on a server? / / Quantas vezes não se alterar em um servidor? What does he need it for? O que ele precisa dele para?
SERVER_SIGNATURE=[Truncated] SERVER_SIGNATURE = [truncado]
// How many times does it change on a server? / / Quantas vezes não se alterar em um servidor? What does he need it for? O que ele precisa dele para?
SERVER_SOFTWARE=[Truncated] SERVER_SOFTWARE = [truncado]
// How many times does it change on a server? / / Quantas vezes não se alterar em um servidor? What does he need it for? O que ele precisa dele para?
GATEWAY_INTERFACE=CGI%2F1.1 GATEWAY_INTERFACE = CGI% 2F1.1
// How many times does it change on a server? / / Quantas vezes não se alterar em um servidor? What does he need it for? O que ele precisa dele para?
SERVER_PROTOCOL=HTTP%2F1.1 SERVER_PROTOCOL = HTTP% 2F1.1
// How many times does it change on a server? / / Quantas vezes não se alterar em um servidor? What does he need it for? O que ele precisa dele para?
// This is always POST! / / Este é sempre POST!
REQUEST_METHOD=POST REQUEST_METHOD = POST
// How many times does it change on a server? / / Quantas vezes não se alterar em um servidor? What does he need it for? O que ele precisa dele para?
QUERY_STRING= QUERY_STRING =
// How many times does it change on a server? / / Quantas vezes não se alterar em um servidor? What does he need it for? O que ele precisa dele para?
REQUEST_URI=%2Fwp-comments-post.php REQUEST_URI =% 2Fwp-observações-post.php
// How many times does it change on a server? / / Quantas vezes não se alterar em um servidor? What does he need it for? O que ele precisa dele para?
SCRIPT_NAME=%2Fwp-comments-post.php SCRIPT_NAME =% 2Fwp-observações-post.php
// Why does he need to know where I installed WordPress on my server? / / Por que é que ele precisa de saber onde eu WordPress instalado no meu servidor?
PATH_TRANSLATED=[Truncated] PATH_TRANSLATED = [truncado]
// How many times does it change on a server? / / Quantas vezes não se alterar em um servidor? What does he need it for? O que ele precisa dele para?
PHP_SELF=%2Fwp-comments-post.php PHP_SELF =% 2Fwp-observações-post.php
// This is inane / / Este é Inane
argv=Array argv = Array
// This is inane / / Este é Inane
argc=0 argc = 0
This huge amount of data (considering it is send for every comment) can consume a not-so-insignificant portion of your bandwidth quota, if you get lots of spam. Esta enorme quantidade de dados (considerando-se enviar para cada comentário) pode consumir um não tão insignificante parcela de sua banda de quotas, se você obter lotes de spam.
It is clear Matt & Co. haven’t taken the effort to filter out the unnecessary information, even though they can easily do so. É claro Matt & Co. não tenham tido o esforço para filtrar as informações desnecessárias, mesmo que eles podem facilmente fazer.
Some of these information may also be used by hackers (bad ones). Algumas destas informações podem também ser utilizadas pelos hackers (maus). Remember all information is submitted over the internet in cleartext. Lembre-se todas as informações são apresentadas através da Internet em cleartext.
Kind of makes you feel warm and fuzzy, doesn’t it? Espécie de faz você se sentir quente e difusos, não é mesmo?
Filed under Arquivado em CMS Software CMS Software , De Headline News Headline News , De Pro Blogging Blogging Pro , De Web , De Web Services Web Services , De WordPress | |
| |
RSS 2.0 RSS 2,0 | |
Trackback this Article | este artigo |
Email this Article E-mail este artigo
You may also like to read Você pode também gosta de ler |




April 8th, 2006 at 11:03 pm 8 de abril de 2006 em 11:03 pm
Akismet’s privacy policy is available to the public here (legal translation coming soon): Akismet política de privacidade está disponível para o público aqui (tradução jurídica em breve):
http://akismet.com/privacy/
Matt would [probably] be glad if you were to contact him with your privacy/security concerns. Matt ia [provavelmente] ser feliz se estivesse para entrar em contato com ele a sua privacidade / preocupações de segurança. If you send your inquiry through Se você enviar sua consulta através de the Akismet contact form Akismet o formulário de contato , he’ll usually respond within the week. , Ele geralmente respondem dentro da semana.
April 9th, 2006 at 6:00 pm 9 de abril de 2006 em 6:00 pm
We do strip out potentially sensitive data, like your login cookie. Estamos a fazer strip potencialmente sensíveis de dados, como o seu login cookie. The rest is entirely harmless, and actually quite useful in identifying spam. O resto é totalmente inofensivo, e realmente bastante útil para identificar spam. You can exclude it, but the effectiveness of Akismet will go down. Você pode excluí-lo, mas a eficácia da Akismet vão ficar.
April 10th, 2006 at 9:36 am 10 de abril de 2006 em 9:36 am
Matt,
Thanks for the clarifications. Graças para os esclarecimentos. However I couldn’t understand why you need data which never changes for any user like: No entanto eu não conseguia entender porque você precisa de dados que nunca muda para qualquer usuário desejar:
CONTENT_TYPE=application%2Fx-www-form-urlencoded CONTENT_TYPE = candidatura% 2Fx-www-form-urlencoded
REQUEST_METHOD=POST REQUEST_METHOD = POST
SERVER_PORT=80 // May very rarely change SERVER_PORT = 80 / / maio mudar muito raramente
SERVER_PROTOCOL=HTTP%2F1.1 SERVER_PROTOCOL = HTTP% 2F1.1
GATEWAY_INTERFACE=CGI%2F1.1 GATEWAY_INTERFACE = CGI% 2F1.1
etc. etc
Also there are several pieces of data which I cannot see (irrespective of the algorithm you are using, which I personally think is a variant of naive bayesian with manual blacklisting Também há vários pedaços de dados que não vejo (independentemente do algoritmo que você está usando, eu pessoalmente acho que é uma variante do bayesian ingénuo manual com listas negras
) how they can help in analysing spam like my servers SCRIPT_FILENAME or PATH_TRANSLATED. ) Como eles podem ajudar na análise do spam como a minha servidores SCRIPT_FILENAME ou PATH_TRANSLATED.
I could see you have a provision in code to filter out certain data from list. Eu podia ver você tem uma disposição em código para filtrar determinado a partir de dados lista. Why not use it to get only the data that you need. Por que não usá-lo para obter apenas os dados que você precisa.
Looking forward to your response. Olhando para o futuro à sua resposta.
Best, Melhor,
Angsuman
April 10th, 2006 at 9:37 am 10 de abril de 2006 em 9:37 am
James,
I guess I reached him faster this way Eu acho que ele me chegou mais rápido desta forma
Thanks for your suggestions. Obrigado por suas sugestões.
Best, Melhor,
Angsuman
April 11th, 2006 at 12:14 pm 11 de abril de 2006 em 12:14 pm
[...] In addition, over at Simple Thoughts, Angsuman Chakraborty wrote an interesting post entitled, “What Matt Mullenweg (WordPress Author) Knows About You (WordPress & Akismet Plugin User).” There, he figured out what kind of info Akismet sends back to interpret comments as spam / not spam. [...] Além disso, durante a pensamentos simples, Angsuman Chakraborty escreveu um interessante post intitulado, "O que Matt Mullenweg (WordPress Autor) Você conhece (WordPress & Akismet Plugin Usuário)." Lá, ele figurou no qual o tipo de info Akismet envia de volta para interpretar comentários como spam / não spam. All this was very interesting, but it got my no further to my goal of getting out of Akismet jail. Tudo isso foi muito interessante, mas ainda não tenho a minha para o meu objetivo de sair da prisão Akismet. My identity had been taken by a black box for unknown reasons, and there was no way to get it back. A minha identidade tinha sido tomada por uma caixa preta por razões desconhecidas, e não havia nenhuma maneira de obtê-lo de volta. Granted, on the net it is very easy to change your identity, but I had been writing as myself for quite awhile. Concedida, na rede, é muito fácil de mudar a sua identidade, mas eu tinha sido escrito por mim mesmo como bastante tempo. Why would I want to give up what little, if any, reputation I have? Por que eu quero dar-se aquilo que pouco, ou nenhum, tenho fama? Especially to the black box? Especialmente para a caixa preta? [...]
January 16th, 2007 at 8:47 am 16 de janeiro de 2007 em 8:47 am
I my - maybe simple - views these informations are required for analyzing spam: Eu minha - talvez simples - vistas estas informações são necessárias para análise de spam:
comment_content # Yeah, sure… comment_content # Sim, claro…
comment_author* # All three together comment_author * # Todos os três juntos
blog_url (a splogger can easily remove that URL, so you still have his server’s IP number. But what about a sblog like spammer-blog.wordpress.com? Got it? IP is useless, two! blog_url (splogger pode facilmente remover uma URL que, portanto, você ainda tem o seu número IP do servidor. Mas o que dizer de uma sblog como spammer-blog.wordpress.com? Got it? IP é inútil, dois!
And even the client’s IP/user-agent-string are useless because of open proxies. E até mesmo o IP do cliente / usuário-agente-string são inúteis porque de abrir proxies. Yeah, you can blacklist that IP numbers, but how many open proxies exist in the wide world? Sim, é possível que a lista negra números IP, mas como muitos proxies abertos existem no mundo vasto? 100,000 ??? 100.000?
Well, I’ll remove all information which you really don’t need to know from my blog (like absolute paths and such). Pois bem, eu vou retirar todas as informações que você realmente não precisa saber de meu blog (como caminhos absolutos e tal). Only I need to know where your scripts are installed and not you. Eu só preciso de saber onde seus scripts estão instalados e não você.
I know you can blacklist my ID number so move on. Eu sei que você pode lista negra meu número de identificação de modo a passar. I have more anti-spam plug-ins left to replace with Akismet. Tenho mais anti-spam plug-ins de esquerda para substituir a Akismet.
And Akismet isn’t the ultimate death for spam comments, as well. Akismet e não é a última a morte de spam comentários, também.
I’m not against Matt and all the other people behind Akismet but I really need to know why, why, why you need to know so much useless informations from my blog? Não estou contra Matt e todas as outras pessoas por trás Akismet mas eu realmente precisam de saber por que razão, por que razão, por que você precisa saber tanta informação inútil do meu blog? Why the comment ID why the absolute path of my script installation? Porque a comentar as razões pelas quais o ID do caminho absoluto do meu script instalação?
So long and all the best, Tanto tempo e tudo de melhor,
Roland
January 16th, 2007 at 8:50 am 16 de janeiro de 2007 em 8:50 am
An addition to my previous post. Um aditamento ao meu post anterior. I’m saying this to Matt not to Angsuman. Eu estou a dizer isto para não Angsuman Matt.
August 1st, 2007 at 5:53 pm 1 º de agosto, 2007, 5:53 pm
Don’t forget that Akismet is integrated into other tools too, such as the cakePHP framework so some of that info will be relevant there. Não se esqueça que Akismet está integrado em outras ferramentas, também, como o CakePHP quadro tão algumas das informações que serão relevantes lá.
I’m with you on the server path type of thing but the actual calling script is probably important for identifying the weak points (or high traffic points ) on a site. Eu estou com você no servidor caminho tipo de coisa, mas o real chamando script é provavelmente importante para a identificação dos pontos fracos (ou de alto tráfego pontos) em um site. More for future development than current spam detection. Mais para o desenvolvimento futuro do que atual spam detecção.
I wouldn’t be blogging today if it wasn’t for Akismet and Bad Behaviour - as it is I have all comments on moderation anyway… it’s that bad! Eu não seria blogs hoje se não fosse por Akismet e mau comportamento - como se eu tenho todos os comentários sobre moderação… assim mesmo que ele é mau!