Cómo el clasificador bayesian ingenuo se puede hacer ineficaz
Acabo de recibir un email que es claramente Spam. Sin embargo SpamBayes piensa que hay una .13% probabilidad que es un Spam.
Tengo una recopilación grande - 623 3113 del Spam mensajes buenos y.
En un poste anterior discutí que SpamBayes no está trabajando para mí más. Esto es un buen ejemplo a ese efecto.
Franco no hay mucho SpamBayes o cualquier ingenuo-bayesian-filtro puede hacer sobre él. Heche una ojeada el mensaje abajo.
Tema: Re: Spyware ¿Los iconos de escritorio se agregan automáticamente a la mesa? ¿Sufrimiento de cambio inexplicado del Home Page? Es muy probable que sean servidos para arriba por el software del spyware Removedor Highest-Rated del Spyware del intento 2005: Descarga gratuita aquí: http:// [el acoplamiento del afiliado del Spam… corrigió] Prevenga la instalación del spyware de los secuestradores Prevenga la instalación del spyware de los secuestradores Prevenga la instalación del spyware del adware y otros parásitos potencialmente indeseados. Ahora intente nuestra exploración en línea: http:// [el acoplamiento del afiliado del Spam… corrigió] Q-u^1*t [el acoplamiento del afiliado del Spam… corrigió]
Los jefes de mensaje son igualmente sin interés para SpamBayes. Aquí es lo que piensa SpamBayes en él.
Cuenta del Spam: el 13% (0.130563) palabra spamprob #spam del #ham “*H*” 0.740598 - - “*S*” 0.001723 - - “jefe: En-Contestar-A: 1” 0.0879684 164 78 “potencialmente” 0.147771 8 6 “página” 0.175691 91 96 “probablemente” 0.195508 18 21 “instalación” 0.197697 8 9 “sirvió” 0.201793 7 8 “tema:: ” 0.227479 282 414 “software” 0.241129 112 177 “cambie” 0.247864 77 126 “sufrimiento” 0.252365 4 6 “transferencia directa” 0.254508 45 76 “a: addr: angsuman” 0.262497 411 730 “jefe: Recibido: 4” 0.265284 88 158 “agregó” 0.288257 29 58 “intento” 0.312818 57 129 “otro” 0.313797 171 390 “prevenga” 0.315326 12 27 “explore” 0.345157 4 10 “siendo” 0.34637 58 153 “muy” 0.360483 95 267 “salto: 10” 0.361028 183 516 “ahora: ” 0.370986 10 29 “ése” 0.375101 345 1034 “ellos” 0.375572 101 303 “sea” 0.385233 349 1092 “contestar-a: ningunos” 0.393789 504 1635 “aquí: ” 0.608336 15 117 “adware” 0.653949 0 1 “indeseado” 0.665617 2 21 “2005” 0.79075 1 22 “spyware” 0.820111 0 4 “URL: discon” 0.820111 0 4 “URL: 700” 0.844931 0 5
La manipulación de este Spam es muy dura para un NBC. No incluye palabras claves estándar unas de los. No intenta directamente venderle cualquier cosa. La opción de la lengua demuestra muestras de un spammer inteligente. Incluye las porciones de palabras non-spammy con todo del contexto relevantes que baja la cuenta. La única palabra spammy (parada) se ha enmascarado. Incluso incluye palabras del jamón en el URL.
A un ojo humano esto es claramente un Spam. Sin embargo no está a una computadora.
Nota: Usted puede asignar posiblemente la cuenta muy alta al spyware o al adware de las palabras, pero por otra parte pueden contaminar siempre el espacio de la palabra con las faltas de ortografía. También sus amigos pueden querer informarle sobre AdAware, una herramienta válida del retiro del spyware.
Necesitamos acercamiento acodado del retiro del Spam en la fuente manejar este tipo de spammeres.
Archivado debajo del reloj del Spam, tecnología, Web |
|
RSS 2.0 |
Envíe por correo electrónico este artículo
Usted puede también tener gusto de leer |


Agregue a los favoritos de Technorati


































20 de marzo de 2005 en el 11:51
Wirksam del bedingt del nur del sind del filtro de Bayessche
El Spam-Beispiel simple vor del ein del stellt de los pensamientos, un filtro de Bayessche del sich del dem muere Zähne ausbeissen. El viel del nie del noch de Ich habe von solcher Filterei gehalten, allem del vor, dazu del hombre del weil que muere el mal de otro tiempo empfangen del email del ganze muss. Ist del besser de Viel…
4 de mayo de 2005 en el 1:17
el hru de [...] un acoplamiento, ocasiones es el URL de su sitio que origina contiene algunas de estas palabras claves. Los spammeres están consiguiendo más elegantes. Es un neve [...]