What Matt Mullenweg (WordPress Author) Knows About You (WordPress & Akismet Plugin User) Что Matt Mullenweg (WordPress автор) не знает о вас (WordPress и Akismet плагин пользователя)
I took a look at the data we are sending to Akismet, a WordPress plugin for comment spam protection, for each comment submitted on your blog, if you use this plugin for comment spam prevention. Я взял взглянуть на данные мы направляем на Akismet, WordPress плагин для комментариев защиту от спама, за каждый комментарий, представленный в своем блоге, если вы используете этот плагин для комментариев защита от спама. I have recently Недавно я started using Akismet начали использовать Akismet , a WordPress plugin from WordPress author , WordPress плагин из WordPress автора Matt Mullenweg Мэтт Mullenweg . I have to say I was surprised at the copious amount of data, some sensitive, being sent to Matt’s server for handling every single comment. Я должен сказать, я был удивлен на обширной объем данных, некоторые аспекты, были отправлены в Matt сервер для обработки каждого отдельного комментария.
Tons of useless (for spam protection) information is being sent for every comment, most of which rarely, if ever, changes on a server. Тонны бесполезных (для защита от спама) информация доводится для каждого комментария, большинство из которых редко, если когда-либо изменений на сервере.
Here are the data that was sent to Akismet server for a single test comment on my blog. Ниже приведены данные о том, что был направлен Akismet сервер для одного испытания комментарий в моем блоге. I have commented on them inline. Я прокомментировал их письма.
comment_post_ID=1128 // Why does he need this? comment_post_ID = 1128 / / Почему он нужен этот?
comment_author=Angsuman+Chakraborty comment_author = Angsuman + Чакраборти
comment_author_email=angsuman%40taragana.com comment_author_email = angsuman% 40taragana.com
comment_author_url=http%3A%2F%2Fblog.taragana.com%2F comment_author_url = http% 3A% 2F% 2Fblog.taragana.com% 2F
comment_content=[Actual comment] comment_content = [Актуальные комментарий]
comment_type= comment_type =
user_ID=1 // Why does he need this? user_ID = 1 / / Зачем он нужен этот?
user_ip=59.93.245.60 user_ip = 59.93.245.60
user_agent=[Truncated] user_agent = [усеченный]
referrer=[Truncated - Post url] реферера = [усеченный - пост url]
blog=http%3A%2F%2Fblog.taragana.com блога = http% 3A% 2F% 2Fblog.taragana.com
CONTENT_LENGTH=98 CONTENT_LENGTH = 98
// Isn’t it obvious? / / Не является ли это очевидным? Why send it? Зачем отправлять его? Does it ever change? Есть ли когда-либо изменений?
CONTENT_TYPE=application%2Fx-www-form-urlencoded CONTENT_TYPE = применении% 2Fx-веб-форм-urlencoded
// What is he doing with it? / / Что же он делает с ней? This information is useless for spam protection. Данная информация является бесполезной для защита от спама.
DOCUMENT_ROOT=[File system path] DOCUMENT_ROOT = [Файловая система путь]
// Why does he need this? / / Почему он нужен этот? Yet another useless junk. Еще одна нежелательная бесполезно.
HTTP_ACCEPT=[Truncated] HTTP_ACCEPT = [усеченный]
// Why does he need this? / / Почему он нужен этот?
HTTP_ACCEPT_CHARSET=[Truncated] HTTP_ACCEPT_CHARSET = [усеченный]
HTTP_ACCEPT_LANGUAGE=en-us%2Cen%3Bq%3D0.5 HTTP_ACCEPT_LANGUAGE = ан-нас 2Cen%% 3Bq% 3D0.5
// Why does he need this? / / Почему он нужен этот?
HTTP_CONNECTION=keep-alive HTTP_CONNECTION =-оставлять в живых
HTTP_HOST=blog.taragana.com HTTP_HOST = blog.taragana.com
// Why does he need this? / / Почему он нужен этот?
HTTP_KEEP_ALIVE=300 HTTP_KEEP_ALIVE = 300
HTTP_REFERER=[Truncated] HTTP_REFERER = [усеченный]
HTTP_USER_AGENT=[Truncated] HTTP_USER_AGENT = [усеченный]
// Why does he have to have my PATH information? / / Почему он должен иметь стезе моей информации?
PATH=[PATH environment variable] PATH = [переменная окружения PATH]
REMOTE_ADDR=59.93.245.60 REMOTE_ADDR = 59.93.245.60
REMOTE_PORT=1567 REMOTE_PORT = 1567
// How many times does it change on a server? / / Сколько раз она изменений на сервере? Why does he need it? Почему он в ней нуждается?
// It contains file system information / / Оно содержит файловую систему информации
SCRIPT_FILENAME=[Truncated] SCRIPT_FILENAME = [усеченный]
// How many times does it change on a server? / / Сколько раз она изменений на сервере?
SERVER_ADDR=69.36.187.98 SERVER_ADDR = 69.36.187.98
// How many times does it change on a server? / / Сколько раз она изменений на сервере? Why does he need it? Почему он в ней нуждается?
SERVER_ADMIN=Postmaster%40taragana.com SERVER_ADMIN = Postmaster% 40taragana.com
SERVER_NAME=blog.taragana.com SERVER_NAME = blog.taragana.com
// How many times does it change on a server? / / Сколько раз она изменений на сервере? What does he need it for? Чему он нуждается в ней для?
SERVER_PORT=80 SERVER_PORT = 80
// How many times does it change on a server? / / Сколько раз она изменений на сервере? What does he need it for? Чему он нуждается в ней для?
SERVER_SIGNATURE=[Truncated] SERVER_SIGNATURE = [усеченный]
// How many times does it change on a server? / / Сколько раз она изменений на сервере? What does he need it for? Чему он нуждается в ней для?
SERVER_SOFTWARE=[Truncated] SERVER_SOFTWARE = [усеченный]
// How many times does it change on a server? / / Сколько раз она изменений на сервере? What does he need it for? Чему он нуждается в ней для?
GATEWAY_INTERFACE=CGI%2F1.1 GATEWAY_INTERFACE = CGI% 2F1.1
// How many times does it change on a server? / / Сколько раз она изменений на сервере? What does he need it for? Чему он нуждается в ней для?
SERVER_PROTOCOL=HTTP%2F1.1 SERVER_PROTOCOL = HTTP% 2F1.1
// How many times does it change on a server? / / Сколько раз она изменений на сервере? What does he need it for? Чему он нуждается в ней для?
// This is always POST! / / Это всегда POST!
REQUEST_METHOD=POST REQUEST_METHOD = POST
// How many times does it change on a server? / / Сколько раз она изменений на сервере? What does he need it for? Чему он нуждается в ней для?
QUERY_STRING= QUERY_STRING =
// How many times does it change on a server? / / Сколько раз она изменений на сервере? What does he need it for? Чему он нуждается в ней для?
REQUEST_URI=%2Fwp-comments-post.php REQUEST_URI =% 2Fwp-комментарии-post.php
// How many times does it change on a server? / / Сколько раз она изменений на сервере? What does he need it for? Чему он нуждается в ней для?
SCRIPT_NAME=%2Fwp-comments-post.php SCRIPT_NAME =% 2Fwp-комментарии-post.php
// Why does he need to know where I installed WordPress on my server? / / Почему ему необходимо знать, где я установил WordPress на моем сервере?
PATH_TRANSLATED=[Truncated] PATH_TRANSLATED = [усеченный]
// How many times does it change on a server? / / Сколько раз она изменений на сервере? What does he need it for? Чему он нуждается в ней для?
PHP_SELF=%2Fwp-comments-post.php PHP_SELF =% 2Fwp-комментарии-post.php
// This is inane / / Это inane
argv=Array argv = array
// This is inane / / Это inane
argc=0 argc = 0
This huge amount of data (considering it is send for every comment) can consume a not-so-insignificant portion of your bandwidth quota, if you get lots of spam. Этот огромный объем данных (с учетом его отправить на каждый комментарий) могут потреблять не столь незначительную часть вашего трафика квоту, если вы получаете много спама.
It is clear Matt & Co. haven’t taken the effort to filter out the unnecessary information, even though they can easily do so. Очевидно, Мэтт и Ко не предприняли усилий для отфильтровывания ненужной информацией, даже если они могут легко это сделать.
Some of these information may also be used by hackers (bad ones). Некоторые из них информация может также быть использована хакерами (плохие). Remember all information is submitted over the internet in cleartext. Помните, вся информация представляется в интернет-открытым текстом.
Kind of makes you feel warm and fuzzy, doesn’t it? Вид заставляет вас чувствовать себя тепло и нечетких, не так ли?
Filed under Поданного в соответствии с CMS Software CMS Software , Headline News Headline News , Pro Blogging Про блоги , Web Веб , Web Services Web Services , WordPress | |
| |
RSS 2.0 RSS 2,0 | |
Trackback this Article | это статья |
Email this Article Отослать Статья
You may also like to read Вы можете также люблю читать |




April 8th, 2006 at 11:03 pm 8 апреля 2006 года в 11:03 вечера
Akismet’s privacy policy is available to the public here (legal translation coming soon): Akismet политикой конфиденциальности доступна для общественности здесь (перевод правовых скоро будет):
http://akismet.com/privacy/
Matt would [probably] be glad if you were to contact him with your privacy/security concerns. Мэтт бы [вероятно] будем рады, если вы должны были связаться с ним с вашей личной жизни / безопасности. If you send your inquiry through Если вы послали свой запрос через the Akismet contact form Akismet контактная форма , he’ll usually respond within the week. , То он будет, как правило, ответить в течение недели.
April 9th, 2006 at 6:00 pm 9 апреля 2006 года в 6:00 вечера
We do strip out potentially sensitive data, like your login cookie. Мы делаем полосу из потенциально важные данные, как ваш логин cookie. The rest is entirely harmless, and actually quite useful in identifying spam. Остальное вполне безобидными, а на самом деле очень полезным в деле выявления спама. You can exclude it, but the effectiveness of Akismet will go down. Чтобы исключить ее, но эффективность Akismet войдет.
April 10th, 2006 at 9:36 am 10 апреля 2006 года в 9:36 утра
Matt, Мэтт,
Thanks for the clarifications. Спасибо за разъяснения. However I couldn’t understand why you need data which never changes for any user like: Однако я не мог понять, почему вы должны данные, которые не меняется для любого пользователя, типа:
CONTENT_TYPE=application%2Fx-www-form-urlencoded CONTENT_TYPE = применении% 2Fx-веб-форм-urlencoded
REQUEST_METHOD=POST REQUEST_METHOD = POST
SERVER_PORT=80 // May very rarely change SERVER_PORT = 80 / / Май очень редко перемен
SERVER_PROTOCOL=HTTP%2F1.1 SERVER_PROTOCOL = HTTP% 2F1.1
GATEWAY_INTERFACE=CGI%2F1.1 GATEWAY_INTERFACE = CGI% 2F1.1
etc. т.д.
Also there are several pieces of data which I cannot see (irrespective of the algorithm you are using, which I personally think is a variant of naive bayesian with manual blacklisting Также существует несколько кусков данных, которые я не вижу (независимо от алгоритма вы используете, которую я лично считаю, это вариант наивного bayesian с ручным "черный список"
) how they can help in analysing spam like my servers SCRIPT_FILENAME or PATH_TRANSLATED. ), Каким образом они могут помочь в проведении анализа спама, как мои серверы или SCRIPT_FILENAME PATH_TRANSLATED.
I could see you have a provision in code to filter out certain data from list. Я мог видеть вас есть положение в код, чтобы отфильтровывать определенные данные из списка. Why not use it to get only the data that you need. Почему бы не использовать его только для получения данных о том, что вам нужно.
Looking forward to your response. Ждем вашего ответа.
Best, Лучший,
Angsuman
April 10th, 2006 at 9:37 am 10 апреля 2006 года в 9:37 утра
James, Джеймс,
I guess I reached him faster this way Думаю, я достиг его быстрее, таким образом
Thanks for your suggestions. Спасибо за ваши предложения.
Best, Лучший,
Angsuman
April 11th, 2006 at 12:14 pm 11 апреля 2006 года в 12:14 вечера
[...] In addition, over at Simple Thoughts, Angsuman Chakraborty wrote an interesting post entitled, “What Matt Mullenweg (WordPress Author) Knows About You (WordPress & Akismet Plugin User).” There, he figured out what kind of info Akismet sends back to interpret comments as spam / not spam. [...] Кроме того, более чем на простой мысли, Angsuman Чакраборти написал интересный пост под названием "Что Matt Mullenweg (WordPress автора) Знает About You (WordPress и Akismet Плагин пользователя)." Там он понял, какого рода информация Akismet отсылает обратно к толкованию комментарии как спам / не спам. All this was very interesting, but it got my no further to my goal of getting out of Akismet jail. Все это было очень интересно, но она не получила мое дополнение к моей цели выхода из Akismet тюрьму. My identity had been taken by a black box for unknown reasons, and there was no way to get it back. Моя идентичность были приняты черного ящика по неизвестным причинам, и нет никакой возможности получить его обратно. Granted, on the net it is very easy to change your identity, but I had been writing as myself for quite awhile. Разумеется, по чистой очень легко изменить вашу личность, но я была письменной форме, как сам довольно некоторое время. Why would I want to give up what little, if any, reputation I have? Почему я хочу бросить то, что мало, если таковые имеются, я имею репутацию? Especially to the black box? Особенно в черном ящике? [...]
January 16th, 2007 at 8:47 am 16 января 2007 года в 8:47 утра
I my - maybe simple - views these informations are required for analyzing spam: Я моя - может быть, просто - считает эти данные необходимы для анализа спама:
comment_content # Yeah, sure… comment_content # Да, конечно…
comment_author* # All three together comment_author # * Все три вместе
blog_url (a splogger can easily remove that URL, so you still have his server’s IP number. But what about a sblog like spammer-blog.wordpress.com? Got it? IP is useless, two! blog_url (splogger можно легко удалить этот URL, так что вы до сих пор его сервер IP-номером. Но что можно сказать о sblog как спамер-blog.wordpress.com? Нашли ли? IP бесполезно, два!
And even the client’s IP/user-agent-string are useless because of open proxies. И даже клиента IP / агента-пользователя-строка бесполезны из-за открытых прокси. Yeah, you can blacklist that IP numbers, but how many open proxies exist in the wide world? Да, вы можете, что черный список IP номеров, а в том, как много открытых прокси существуют в широкий мир? 100,000 ??? 100.000?
Well, I’ll remove all information which you really don’t need to know from my blog (like absolute paths and such). Ну, я удалить всю информацию, которая вам совсем не нужно знать, из моего блога (как абсолютные пути, и такие). Only I need to know where your scripts are installed and not you. Только мне нужно знать, где ваши скрипты установлены, а не вас.
I know you can blacklist my ID number so move on. Я знаю, вы можете в черный список мой идентификационный номер так двигаться вперед. I have more anti-spam plug-ins left to replace with Akismet. У меня возникли более анти-спам подключаемых модулей для замены левой с Akismet.
And Akismet isn’t the ultimate death for spam comments, as well. И Akismet не является конечной смертной казни за спам комментариев, как это хорошо.
I’m not against Matt and all the other people behind Akismet but I really need to know why, why, why you need to know so much useless informations from my blog? Я не против Мэтт и всех других людей позади Akismet но мне действительно нужно знать, почему, зачем, зачем нужно знать столько бесполезной информации с моего блога? Why the comment ID why the absolute path of my script installation? Почему комментарий ID почему абсолютный путь мой сценарий установки?
So long and all the best, До тех пор, и все лучшее,
Roland Роланд
January 16th, 2007 at 8:50 am 16 января 2007 года в 8:50 утра
An addition to my previous post. Помимо моего предыдущего поста. I’m saying this to Matt not to Angsuman. Я говорю это к Мэтт не Angsuman.
August 1st, 2007 at 5:53 pm 1 августа 2007 года в 5:53 вечера
Don’t forget that Akismet is integrated into other tools too, such as the cakePHP framework so some of that info will be relevant there. Не будем забывать, что Akismet интегрируется в другие инструменты тоже, как, например, cakePHP рамках некоторых тем, что информация будет иметь отношение там.
I’m with you on the server path type of thing but the actual calling script is probably important for identifying the weak points (or high traffic points ) on a site. Я с вами по серверу путь типа, но фактический призыв сценарий, вероятно, важно для выявления слабых мест (или большим трафиком очков) на сайте. More for future development than current spam detection. Функции для будущего развития, чем нынешние обнаружения спама.
I wouldn’t be blogging today if it wasn’t for Akismet and Bad Behaviour - as it is I have all comments on moderation anyway… it’s that bad! Я бы не блоги сегодня, если она не была для Akismet и Бад поведения - как это я все замечания по умеренности в любом случае… Это очень плохо!