New techniques of spamming… De nouvelles techniques de spamming…
For quite sometime naive bayesian classifier based SPAMBayes filtered my emails very accurately with very few false positives. Depuis un certain temps naïf classificateur bayésien basé SPAMBayes filtré à mes e-mails très précis avec très peu de faux positifs.
Recently however I have noticed few trends in spamming which are alarming in nature. Récemment, cependant, j'ai remarqué quelques tendances dans les abus et le spam qui sont alarmants dans la nature.
- Database poisoning: Using otherwise innocuous words (ham words) in a SPAM, thereby effectively poisoning the database in the long run Base de données intoxication: L'utilisation d'autres mots inoffensifs (jambon mots) dans un SPAM, ce qui a pour effet d'empoisonnement la base de données à long terme
- Junk Tags: Hiding spam words by inserting invalid HTML tags in between words. Junk Tags: Hiding spam mots en insérant des balises HTML invalide dans entre les mots. Any HTML parser ignores tags it doesn’t understand, thereby resulting in properly viewable document Tout analyseur ignore HTML tags il ne comprend pas, de ce fait, bien visible document
- Invalid Words: Spam word like mortgage etc. are masked by inserting special characters or junk characters in between. Les mots non valide: Spam mot comme hypothèque etc sont masqués en insérant des caractères spéciaux ou des caractères indésirables entre les deux.
Solutions I could think of: Solutions je pourrais penser à:
- Most of the database poisoning email tend to be classified in Not Sure category. La plupart des intoxications base de données e-mail ont tendance à être classées dans la catégorie Ne sais pas. I suggest that you delete them instead of classifying them as spam. Je vous suggère de les supprimer au lieu de les classer comme du spam. However it still requires that we spend some time for it which is what I don’t like. Toutefois, il exige toujours que nous passons un certain temps pour lui, qui est ce que je n'aime pas.
- Junk Tags: Add a filter in front of bayesian classifier to eliminate junk tags Junk Tags: Ajouter un filtre bayésien devant classificateur à éliminer les balises indésirables
- Invalid Words: No-exact matching algorithms from Lucene etc. should help. Les mots non valide: Non-correspondance exacte algorithmes de Lucene etc devrait vous aider.
I have recently noticed a significant increase in mortgage spams. J'ai récemment remarqué une augmentation significative des spams hypothécaire. It should be easy to tackle them by legal means. Il devrait être facile de les résoudre par des moyens légaux.
Overall the game is becoming tougher for spam prevention. Dans l'ensemble, le jeu est de plus en plus sévères pour prévenir le spam. A combination of existing techniques are required for any spam filters to remain effective. Une combinaison de techniques existantes sont nécessaires pour tout les filtres anti-spam de rester efficace.
Looking forward to hear your thoughts. Dans l'attente de connaître votre opinion.
Filed under Classé sous Spam Watch Spam Watch , Web | |
| |
RSS 2.0 RSS 2,0 | |
Email this Article Envoyer cet article
You may also like to read Vous mai également à lire |





July 29th, 2004 at 2:49 am Juillet 29th, 2004 at 2:49 am
I have tried all the software solutions to twarting spam. J'ai essayé toutes les solutions logicielles de twarting spam. I have yet to see one that works as good as simply owning a domain and creating many email addresses. Je n'ai pas encore vu un qui fonctionne aussi bonne que simplement posséder un domaine et de créer de nombreuses adresses e-mail. One for each site I visit. Un pour chaque site que je visite. Like the one I used here. À l'instar de celle que j'ai utilisée ici. If I start getting spam from that address, I simply forward it to Si je commencer à spam de cette adresse, j'ai simplement à transmettre null@null.net and that’s that. et c'est tout. I have about 30 email addresses generating well over 250 spams a day. J'ai environ 30 adresses e-mail et génératrices de plus de 250 spams par jour. They are all being forwarded to Ils sont tous d'être transmis à null@null.net (Sure hope no one ever gets that address). (J'espère ne jamais se que l'adresse).
I *NEVER* give out my main email address to anyone! I * * NE JAMAIS donner mon adresse e-mail à qui que ce soit! All the non spam addresses get forwarded to my real email account so I can read them and respond to them. Toutes les adresses non spam obtenir transmis à mon vrai compte de messagerie afin que je puisse les lire et y répondre. Sure, at that point my real address get’s sent out. Bien sûr, à ce moment-là mon adresse réelle get envoyé. However, it’s not accidently published on the web. Toutefois, il n'est pas accidentellement publié sur le Web. At least not by posting it on a blog or a web store. Du moins pas par l'affichage sur un blog ou une boutique en ligne.
October 15th, 2004 at 5:31 am Octobre 15, 2004 at 5:31 am
I facing the same problem. Je confrontés au même problème. The new genre of spam that I noticed was that a bunch of unrelated words were pushed in at the end of the e-mail. Le nouveau type de spam que j'ai remarqué, c'est que le groupe de mots indépendants ont été repoussés à la fin de l'e-mail. These words are really rare words gathered from different contexts. Ces mots sont vraiment rares paroles recueillies auprès des contextes différents.
Do you have any suggestions for it? Avez-vous des suggestions pour le faire?