New techniques of spamming…新しい技術のスパミング…
For quite sometime naive bayesian classifier based SPAMBayes filtered my emails very accurately with very few false positives.純真なベイズ分類を非常にいつか私の電子メールフィルタリングをベースspambayes非常に正確に非常にいくつかの偽陽性です。
Recently however I have noticed few trends in spamming which are alarming in nature.しかし私はいくつかの最近の動向スパミングに気づいたのは注意すべきである。
- Database poisoning: Using otherwise innocuous words (ham words) in a SPAM, thereby effectively poisoning the database in the long runデータベース中毒:当たり障りのない言葉を使用して他の(ハムの言葉)をマーク、それを効果的には、長い目で見れば、データベース中毒
- Junk Tags: Hiding spam words by inserting invalid HTML tags in between words.迷惑タグ:隠れているマークの言葉を挿入する単語の間にHTMLタグが無効です。 Any HTML parser ignores tags it doesn’t understand, thereby resulting in properly viewable document任意のHTMLパーサのタグを無視することはありません理解し、その結果、適切なドキュメントの閲覧
- Invalid Words: Spam word like mortgage etc. are masked by inserting special characters or junk characters in between.無効な言葉:マーク単語のような住宅ローンなどの特殊文字を挿入するマスクの間に文字または迷惑です。
Solutions I could think of:私が考えるソリューション:
- Most of the database poisoning email tend to be classified in Not Sure category.ほとんどの電子メールは、データベースの中毒に分類される傾向があるか分からないカテゴリをクリックします。 I suggest that you delete them instead of classifying them as spam.それらを削除することをお勧めとしてマークの代わりに分類しています。 However it still requires that we spend some time for it which is what I don’t like.しかしまだいくつかの時間を費やす必要が私たちがどのようなことは好きじゃない。
- Junk Tags: Add a filter in front of bayesian classifier to eliminate junk tags迷惑タグ:フィルタを追加する前に迷惑を排除するためのタグベイジアン分類
- Invalid Words: No-exact matching algorithms from Lucene etc. should help.無効な言葉:いいえ- Luceneのより正確なマッチングのアルゴリズムなどを参考にします。
I have recently noticed a significant increase in mortgage spams.私は最近、住宅ローンのスパムに有意な増加を気づいたのです。 It should be easy to tackle them by legal means.ばならないことが容易に対処する法的手段です。
Overall the game is becoming tougher for spam prevention.全体のゲームは厳しいのマークの予防になる。 A combination of existing techniques are required for any spam filters to remain effective.既存の技術を組み合わせて任意の迷惑メールフィルタの設定が必要ですを維持する効果的です。
Looking forward to hear your thoughts.あなたの考えを聞くを楽しみにしています。
Filed under提出されて Spam Watchマークwatch , 、 Webウェブ | |
| |
RSS 2.0 RSS 2.0を | |
Email this Article電子メールこの記事
You may also like to readを読むようにすることも可能 |




July 29th, 2004 at 2:49 am 2004年7月29日の午前9:49
I have tried all the software solutions to twarting spam.私はすべてのソフトウェアソリューションを試みたtwartingマークです。 I have yet to see one that works as good as simply owning a domain and creating many email addresses.私を見ていない作品としてはいいとして、単に1つのドメインを所有している多くの電子メールアドレスを作成します。 One for each site I visit.各サイトの1つは私が訪問します。 Like the one I used here.ここで1つの私のように使われています。 If I start getting spam from that address, I simply forward it toすればよいスタート]ボタンを就学許可証のマークから、そのアドレスに、私だけで次のアドレスに転送 null@null.net and that’s that.とのことです。 I have about 30 email addresses generating well over 250 spams a day.私は約30電子メールアドレスを生成をはるかに上回る250スパムしております。 They are all being forwarded to彼らはすべてが転送されることに null@null.net (Sure hope no one ever gets that address). (確認希望の1つ、そのアドレスを取得まで) 。
I *NEVER* give out my main email address to anyone!私*決して*私のメインのメールアドレスを出す誰! All the non spam addresses get forwarded to my real email account so I can read them and respond to them.迷惑メールアドレス以外のすべての私の本当の電子メールアカウントに転送されることに読めるし、だから対応しています。 Sure, at that point my real address get’s sent out.確かに、その時点で私の本当のアドレスを取得するのに送信します。 However, it’s not accidently published on the web.しかし、それは誤ってウェブ上に公開されます。 At least not by posting it on a blog or a web store.投稿ではなく、少なくともそれは、ブログやウェブストアです。
October 15th, 2004 at 5:31 am 2004年10月15日5:31アム
I facing the same problem.私と同じ問題に直面します。 The new genre of spam that I noticed was that a bunch of unrelated words were pushed in at the end of the e-mail.新しいジャンルのマークに気付いたいたのは、大勢のプッシュには無関係な言葉は、電子メールの最後にします。 These words are really rare words gathered from different contexts.これらの言葉は本当にまれな言葉を別のコンテキストから収集します。
Do you have any suggestions for it?任意のアドバイスをお持ちですか?