New techniques of spamming… Las nuevas técnicas de spamming…
For quite sometime naive bayesian classifier based SPAMBayes filtered my emails very accurately with very few false positives. Desde hace algún clasificador bayesian ingenuo SPAMBayes filtrado basado en mis correos electrónicos con gran precisión con muy pocos falsos positivos.
Recently however I have noticed few trends in spamming which are alarming in nature. Recientemente, sin embargo he observado algunas tendencias en el envío de correo basura que son alarmantes en la naturaleza.
- Database poisoning: Using otherwise innocuous words (ham words) in a SPAM, thereby effectively poisoning the database in the long run Base de Datos de la intoxicación: Usar palabras inocua (jamón de palabras) en un SPAM, con lo que efectivamente envenenamiento en la base de datos a largo plazo
- Junk Tags: Hiding spam words by inserting invalid HTML tags in between words. Etiquetas de la chatarra: Ocultar el spam mediante la inserción de palabras no válidos en las etiquetas HTML entre las palabras. Any HTML parser ignores tags it doesn’t understand, thereby resulting in properly viewable document Cualquier HTML parser ignora las etiquetas que no entiende, por lo que puede visualizarse correctamente en el documento
- Invalid Words: Spam word like mortgage etc. are masked by inserting special characters or junk characters in between. Las palabras no válido: Spam palabra como hipotecas, etc están enmascarados por la inserción de caracteres especiales o caracteres basura en el medio.
Solutions I could think of: Soluciones pude pensar en:
- Most of the database poisoning email tend to be classified in Not Sure category. La mayor parte de la base de datos de envenenamiento de correo electrónico tienden a ser clasificados en la categoría No estoy seguro. I suggest that you delete them instead of classifying them as spam. Le sugiero que eliminarlos en lugar de la clasificación como spam. However it still requires that we spend some time for it which is what I don’t like. Sin embargo, todavía requiere que pasar algún tiempo para que que es lo que no me gusta.
- Junk Tags: Add a filter in front of bayesian classifier to eliminate junk tags Etiquetas de la chatarra: Añadir un filtro delante de bayesian clasificador de basura para eliminar las etiquetas
- Invalid Words: No-exact matching algorithms from Lucene etc. should help. Las palabras no válido: No-la concordancia exacta algoritmos de Lucene etc debe ayudar.
I have recently noticed a significant increase in mortgage spams. Recientemente he notado un aumento significativo de la hipoteca spams. It should be easy to tackle them by legal means. Debería ser fácil para hacer frente a ellos por medios legales.
Overall the game is becoming tougher for spam prevention. En general el juego es cada vez más estrictas para la prevención del spam. A combination of existing techniques are required for any spam filters to remain effective. Una combinación de técnicas existentes son necesarios para cualquier filtros de spam para seguir siendo eficaz.
Looking forward to hear your thoughts. El mirar adelante para oír sus pensamientos.
Filed under Filed under Spam Watch Spam Watch , Web | |
| |
RSS 2.0 RSS 2,0 | |
Email this Article Enviar artículo
You may also like to read También puede leer |




July 29th, 2004 at 2:49 am 29 de julio de 2004 a las 2:49 am
I have tried all the software solutions to twarting spam. He intentado todas las soluciones de software para twarting spam. I have yet to see one that works as good as simply owning a domain and creating many email addresses. Yo todavía no han visto uno que funcione tan bien como simplemente ser dueño de un dominio y la creación de muchas direcciones de correo electrónico. One for each site I visit. Uno para cada sitio que visito. Like the one I used here. Al igual que la que utiliza aquí. If I start getting spam from that address, I simply forward it to Si se me comienza a recibir spam desde esa dirección, simplemente me lo remitirá a null@null.net and that’s that. y eso es que. I have about 30 email addresses generating well over 250 spams a day. Tengo alrededor de 30 direcciones de correo electrónico generando así más de 250 spams por día. They are all being forwarded to Todos ellos están siendo transmitidos a null@null.net (Sure hope no one ever gets that address). (Por supuesto espero que nadie que alguna vez se la dirección).
I *NEVER* give out my main email address to anyone! * I * NUNCA dar a conocer mi dirección de correo electrónico a nadie! All the non spam addresses get forwarded to my real email account so I can read them and respond to them. Todas las direcciones de spam no se transmitió a mi cuenta de correo electrónico real por lo que puedo leer y responder a ellas. Sure, at that point my real address get’s sent out. Claro, en ese momento mi dirección real de obtener la envió. However, it’s not accidently published on the web. Sin embargo, no es accidentalmente publicada en la web. At least not by posting it on a blog or a web store. Al menos no por correo postal en un blog o un almacén de la tela.
October 15th, 2004 at 5:31 am 15 de octubre de 2004 a las 5:31 am
I facing the same problem. I se enfrenta el mismo problema. The new genre of spam that I noticed was that a bunch of unrelated words were pushed in at the end of the e-mail. El nuevo tipo de spam que me di cuenta de que era un montón de palabras sin relación fueron empujados al final de la e-mail. These words are really rare words gathered from different contexts. Estas palabras son muy raras las palabras se reunieron de diferentes contextos.
Do you have any suggestions for it? ¿Tiene alguna sugerencia para ello?