New techniques of spamming… 새로운 기술의 스팸…
For quite sometime naive bayesian classifier based SPAMBayes filtered my emails very accurately with very few false positives. 나이브베이스 분류 기반 SpamBayes가 필터링에 대한 아주 가끔 내 이메일을 매우 정확하게 소수의 잘못된 판단합니다.
Recently however I have noticed few trends in spamming which are alarming in nature. 그러나 최근에 나는 몇 동향을 주목하는 놀라운 자연의 스팸합니다.
- Database poisoning: Using otherwise innocuous words (ham words) in a SPAM, thereby effectively poisoning the database in the long run 데이터베이스를 중독 :를 사용하여 다른 악의없는 단어 (햄의 단어)의 스팸 메일, 그것을 효과적으로 장기의 데이터베이스에 중독
- Junk Tags: Hiding spam words by inserting invalid HTML tags in between words. 정크 태그 : 숨어 스팸 메일 단어 사이에 태그를 삽입하여 단어가 잘못되었습니다. Any HTML parser ignores tags it doesn’t understand, thereby resulting in properly viewable document 어떤 html 태그를 파서를 무시하지 않습니다, 이해를 적절하게 볼 수있습니다 문서를 결과
- Invalid Words: Spam word like mortgage etc. are masked by inserting special characters or junk characters in between. 유효하지 않은 단어 : 스팸 단어를 삽입하여 같은 주택 담보 등은 마스크 사이에 특수 문자 또는 정크 문자를합니다.
Solutions I could think of: 솔루션을 내가 생각할 수있는 :
- Most of the database poisoning email tend to be classified in Not Sure category. 대부분의 데이터베이스를 중독을 이메일로 분류되는 경향이 범주 모르겠합니다. I suggest that you delete them instead of classifying them as spam. 나는 그들을 대신하는 것이 좋습니다 분류 그들을 스팸 메일을 삭제합니다. However it still requires that we spend some time for it which is what I don’t like. 그러나 아직 약간의 시간을 보낼 필요가 우리가 그것이 이해가 안 좋아합니다.
- Junk Tags: Add a filter in front of bayesian classifier to eliminate junk tags 정크 태그 :베이스를 추가 분류를 제거하는 필터에 정크 태그를 앞
- Invalid Words: No-exact matching algorithms from Lucene etc. should help. 유효하지 않은 단어 : 아니오 - lucene 등에서 정확하게 일치하는 알고리즘을 도와야한다.
I have recently noticed a significant increase in mortgage spams. 나는 상당한 증가가 최근 주택 담보 스팸 메일을 발견합니다. It should be easy to tackle them by legal means. 그것은 그들의 법적 의미에 종사 간단합니다.
Overall the game is becoming tougher for spam prevention. 스팸 메일 방지에 대한 전반적인 게임은 점점 더 힘들어지고있습니다. A combination of existing techniques are required for any spam filters to remain effective. 기존의 조합에 필요한 기법은 스팸 메일 필터에 어떤 효과를 유지합니다.
Looking forward to hear your thoughts. 귀하의 의견을 듣는 기대합니다.
Filed under 밑에 Spam Watch 스팸 메일 시계 , Web 웹 | |
| |
RSS 2.0 rss 2.0 | |
Email this Article 전자 우편이 문서
You may also like to read 같은를 읽을 수있습니다 |




July 29th, 2004 at 2:49 am 2004년 7월 29일에서 오전 2시 49분
I have tried all the software solutions to twarting spam. 나는 시도했다 스팸 메일의 모든 소프트웨어 솔루션을 twarting합니다. I have yet to see one that works as good as simply owning a domain and creating many email addresses. 그 방법 중 하나를 참조 아직 나는 똑같고 단순히 많은 이메일 주소를 소유하고있는 도메인을 만들고있습니다. One for each site I visit. 하나는 각 사이트에 방문합니다. Like the one I used here. 여기에 예전처럼 하나. If I start getting spam from that address, I simply forward it to 이 주소를 받기 시작에서 스팸면, 난 그것을 간단하게 전달 null@null.net and that’s that. 그리고 그게을합니다. I have about 30 email addresses generating well over 250 spams a day. 나는 잘은 약 30 개의 이메일 주소를 생성하는 스팸은 하루에 250여 점의합니다. They are all being forwarded to 그들은 모두 어느 정도는 전달 null@null.net (Sure hope no one ever gets that address). (물론 희망, 아무도 제가 주소)를합니다.
I *NEVER* give out my main email address to anyone! * 결코 * 나는 내 메인 이메일 주소를 알려주지 누구든! All the non spam addresses get forwarded to my real email account so I can read them and respond to them. get의 모든 주소가 아닌 스팸 메일의 이메일 계정으로 전달의 진짜 내 답변을 그래서 난 그들과 그들을 읽을 수있습니다. Sure, at that point my real address get’s sent out. 물론, 그 시점에서 내 진짜 주소를 더욱 보냈다. However, it’s not accidently published on the web. 그러나, 사고는 웹에 게시되었습니다. At least not by posting it on a blog or a web store. 블로그에 게시함으로써 적어도 또는 웹 저장소에있습니다.
October 15th, 2004 at 5:31 am 2004년 10월 15일에서 오전 5시 31분
I facing the same problem. 나는 동일한 문제에 직면합니다. The new genre of spam that I noticed was that a bunch of unrelated words were pushed in at the end of the e-mail. 새로운 장르의 스팸 제가 느낀것은 관련이없는 단어가 한 무더기의 끝에 밀어 이메일 - 메일을합니다. These words are really rare words gathered from different contexts. 이 단어는 정말 서로 다른 컨텍스트에서 수집한 희귀 단어합니다.
Do you have any suggestions for it? 혹시 다른 제안을하는 이유는?