New techniques of spamming… Новые методы спамеров…
For quite sometime naive bayesian classifier based SPAMBayes filtered my emails very accurately with very few false positives. За довольно-нибудь наивная bayesian классификаторов на основе SPAMBayes мои письма фильтруются очень точно очень мало ложных срабатываний.
Recently however I have noticed few trends in spamming which are alarming in nature. Недавно же я заметил несколько тенденций в области спама, которые вызывают тревогу в природе.
- Database poisoning: Using otherwise innocuous words (ham words) in a SPAM, thereby effectively poisoning the database in the long run База данных отравления: Использование безвредной иного слова (ветчина слова) в спам, тем самым эффективно отравления базы в долгосрочной перспективе
- Junk Tags: Hiding spam words by inserting invalid HTML tags in between words. Нежелательная Tags: Скрытие спам-слов, включив недействительными HTML-теги в между словами. Any HTML parser ignores tags it doesn’t understand, thereby resulting in properly viewable document Любые HTML-парсер игнорирует теги он не понимает, в результате чего надлежащим просмотра документа
- Invalid Words: Spam word like mortgage etc. are masked by inserting special characters or junk characters in between. Неправильный слова: Спам словом, как ипотека и т.д., в масках, добавив специальные символы или символы нежелательные между ними.
Solutions I could think of: Решения я мог думать о:
- Most of the database poisoning email tend to be classified in Not Sure category. Большинство отравлений базы данных по электронной почте, как правило, следует отнести к категории не уверен. I suggest that you delete them instead of classifying them as spam. Я предлагаю вам удалить их, вместо классифицировать их как спам. However it still requires that we spend some time for it which is what I don’t like. Однако он по-прежнему требует, чтобы мы потратить некоторое время для которых она является то, что я не люблю.
- Junk Tags: Add a filter in front of bayesian classifier to eliminate junk tags Нежелательная Метки: Добавить фильтр в глазах bayesian классификаторов устранить нежелательные теги
- Invalid Words: No-exact matching algorithms from Lucene etc. should help. Неправильный слова: No-точное соответствие алгоритмов с Lucene т.д., должны помочь.
I have recently noticed a significant increase in mortgage spams. Недавно я заметил значительное увеличение ипотечных спамов. It should be easy to tackle them by legal means. Он должен быть легким для их решения законными средствами.
Overall the game is becoming tougher for spam prevention. В целом игра становится все сложнее, для предотвращения спама. A combination of existing techniques are required for any spam filters to remain effective. Сочетание существующих методов, необходимых для любой спам-фильтры, чтобы оставаться эффективным.
Looking forward to hear your thoughts. Ожидая услышать ваши мысли.
Filed under Поданного в соответствии с Spam Watch Спам Часы , Web Веб | |
| |
RSS 2.0 RSS 2,0 | |
Email this Article Отослать Статья
You may also like to read Вы можете также люблю читать |





July 29th, 2004 at 2:49 am 29 июля 2004 года в 2:49 утра
I have tried all the software solutions to twarting spam. Я попытался все программные решения для twarting спама. I have yet to see one that works as good as simply owning a domain and creating many email addresses. Я еще предстоит увидеть, что один работает, как хорошо, так как просто владеть доменом и создавая многочисленные адреса электронной почты. One for each site I visit. Одна для каждого сайта я посещаю. Like the one I used here. Как один я использовал здесь. If I start getting spam from that address, I simply forward it to Если я начну получать спам с этого адреса, я просто направить его null@null.net and that’s that. и вот что. I have about 30 email addresses generating well over 250 spams a day. Я имею около 30 электронных адресов получения более 250 спамов в день. They are all being forwarded to Они все время направляется null@null.net (Sure hope no one ever gets that address). (Конечно надеюсь, никто никогда не запускается на этот адрес).
I *NEVER* give out my main email address to anyone! Я съедены выдавать свой основной адрес электронной почты никому! All the non spam addresses get forwarded to my real email account so I can read them and respond to them. Все адреса, не получают спам направлен на мой реальный адрес электронной почты чтобы я мог прочитать их и ответить на них. Sure, at that point my real address get’s sent out. Понятно, что в этот момент мой реальный адрес получить в разосланы. However, it’s not accidently published on the web. Тем не менее, это не случайно опубликован в Интернете. At least not by posting it on a blog or a web store. По крайней мере, не публикуя ее в блоге или на веб-магазин.
October 15th, 2004 at 5:31 am 15 октября 2004 года в 5:31 утра
I facing the same problem. Я сталкивается с той же проблемой. The new genre of spam that I noticed was that a bunch of unrelated words were pushed in at the end of the e-mail. Новый жанр спама, что я заметил, заключалось в том, что множество несвязанных слов были в толкаемые на конец электронной почте. These words are really rare words gathered from different contexts. Эти слова являются очень редкими словами, собранной из различных контекстах.
Do you have any suggestions for it? Есть ли у вас какие-либо предложения в этом?