New techniques of spamming… Novas técnicas de spamming…
For quite sometime naive bayesian classifier based SPAMBayes filtered my emails very accurately with very few false positives. Por algum tempo bastante ingénuo bayesian classificador baseado SPAMBayes filtrada meus e-mails com muita precisão com muito poucos falsos positivos.
Recently however I have noticed few trends in spamming which are alarming in nature. Recentemente porém tenho notado algumas tendências em matéria de spam que são alarmantes na natureza.
- Database poisoning: Using otherwise innocuous words (ham words) in a SPAM, thereby effectively poisoning the database in the long run Database envenenamento: Usando outro inócuo palavras (palavras presunto) em um SPAM, assim efectivamente envenenamento do banco de dados, a longo prazo
- Junk Tags: Hiding spam words by inserting invalid HTML tags in between words. Lixo Tags: Ocultando spam, inserindo palavras inválidos entre tags HTML em palavras. Any HTML parser ignores tags it doesn’t understand, thereby resulting in properly viewable document Todas as tags HTML parser ignora que não compreende, assim, resultando em documento devidamente visualizável
- Invalid Words: Spam word like mortgage etc. are masked by inserting special characters or junk characters in between. Inválido Palavras: Spam palavra como hipoteca etc são mascarados por inserir caracteres especiais ou entre caracteres de lixo.
Solutions I could think of: Eu poderia pensar em soluções:
- Most of the database poisoning email tend to be classified in Not Sure category. A maior parte da base de dados intoxicação por e-mail tendem a ser classificados na categoria não tem certeza. I suggest that you delete them instead of classifying them as spam. Sugiro que você excluí-las em vez de classificando-as como spam. However it still requires that we spend some time for it which is what I don’t like. No entanto, ainda exige que gastar algum tempo para ele que é o que eu não gosto.
- Junk Tags: Add a filter in front of bayesian classifier to eliminate junk tags Lixo Tags: Adicione um filtro na frente do classificador bayesian para eliminar o lixo tags
- Invalid Words: No-exact matching algorithms from Lucene etc. should help. Palavras inválido: Não-a correspondência exata de algoritmos Lucene etc devem ajudar.
I have recently noticed a significant increase in mortgage spams. Tenho notado recentemente um aumento significativo do número de spams hipoteca. It should be easy to tackle them by legal means. Deveria ser fácil para as resolver por meios legais.
Overall the game is becoming tougher for spam prevention. No geral o jogo está se tornando mais duras para a prevenção spam. A combination of existing techniques are required for any spam filters to remain effective. Uma combinação de técnicas existentes são necessários para qualquer filtros de spam para manter a eficácia.
Looking forward to hear your thoughts. Olhando para a frente para ouvir seus pensamentos.
Filed under Arquivado em Spam Watch Spam Watch , De Web | |
| |
RSS 2.0 RSS 2,0 | |
Email this Article E-mail este artigo
You may also like to read Você pode também gosta de ler |




July 29th, 2004 at 2:49 am 29 de julho, 2004 em 2:49 am
I have tried all the software solutions to twarting spam. Eu tentei todas as soluções de software para twarting spam. I have yet to see one that works as good as simply owning a domain and creating many email addresses. Tenho ainda de ver que uma obra tão boa como simples proprietária de um domínio e criando muitos endereços de e-mail. One for each site I visit. Um para cada site me visitar. Like the one I used here. À semelhança do que eu usei um aqui. If I start getting spam from that address, I simply forward it to Se eu começar a receber spam a partir desse endereço, eu simplesmente apresentando-a null@null.net and that’s that. e isso é isso. I have about 30 email addresses generating well over 250 spams a day. Tenho cerca de 30 endereços de e-mail gerando assim mais de 250 spams por dia. They are all being forwarded to Eles estão sendo enviadas a todos os null@null.net (Sure hope no one ever gets that address). (Claro que não esperamos uma vez que recebe endereço).
I *NEVER* give out my main email address to anyone! I * * NUNCA dar a minha principal endereço de e-mail para ninguém! All the non spam addresses get forwarded to my real email account so I can read them and respond to them. Todos os endereços não receber spam enviadas para o meu real de e-mail para que eu possa lê-los e dar-lhes resposta. Sure, at that point my real address get’s sent out. Claro que, nesse momento o meu verdadeiro endereço's get out enviada. However, it’s not accidently published on the web. No entanto, não é acidentalmente publicado na web. At least not by posting it on a blog or a web store. Pelo menos não, colocando-a em um blog ou uma loja na web.
October 15th, 2004 at 5:31 am 15 de outubro de 2004, às 5:31 am
I facing the same problem. Eu enfrenta o mesmo problema. The new genre of spam that I noticed was that a bunch of unrelated words were pushed in at the end of the e-mail. O novo gênero de spam que eu reparei que era um monte de palavras independentes foram empurrados em, no final do e-mail. These words are really rare words gathered from different contexts. Estas palavras são realmente raras palavras recolhidas a partir de diferentes contextos.
Do you have any suggestions for it? Tem sugestões para ele?