Interbel Software S)

3. Filtro heurístico por puntuación

El método heurístico es el utilizado por el famoso filtro Spam Assassin. Este método considera un mensaje como correo basura si supera una puntuación definida por el administrador. El filtro de spam de MDaemon coloca esa puntuación en función de unas reglas internas.

La técnica heurística paso a paso
Este método consiste en realizar una serie de pruebas sobre cada mensaje, asignando puntuaciones a cada prueba. Algunas de las pruebas que se hacen consisten en comprobar el porcentaje de HTML del mensaje, si contiene colores o palabras sospechosas como “sexo” o “viagra”, o bien si contiene indicios de un origen falsificado. También hay pruebas que restan puntos, como haber sido aprobado por un moderador de lista de correo, tener una firma PGP o ser la respuesta a un mensaje.

Esta puntuación viene asignada por defecto, aunque el sistema agrega nuevas puntuaciones según el aprendizaje bayesiano se va retroalimentando.

El administrador predefine qué hacer cuando un mensaje alcanza cierta puntuación. Ver en el ejemplo:

Se aprecia que un mensaje será considerado spam al alcanzar una puntuación de 0,5, un valor muy restrictivo con el spam. Ese valor se puede variar como se detalla en los ejemplos de las opciones de Spam Filter, de la imagen de arriba. Cuando esto suceda, el usuario verá lo siguiente:

La carpeta Spam irá recogiendo los mensajes de correo basura que hayan alcanzado esa puntuación, insertando una etiqueta que lo califica como SPAM en el propio encabezado. La etiqueta de puntuación es la que se podía ver en la primera imagen, la definida en el campo Etiqueta del asunto. El resto de mensajes no etiquetados como spam irán a parar a la Bandeja de entrada como de costumbre.

En la ficha de las estadísticas del Correo basura (pantalla principal del servidor MDaemon):

se aprecia en tiempo real cómo se puntúa cada elemento de un mensaje (por ejemplo, mucho porcentaje de HTML o la inserción del término “sex” califican con más puntos). Al sumar la puntuaciones, se compara con las opciones definidas por el administrador a la hora de clasificar un mensaje como spam o rechazarlo (ver la primera imagen).

El método heurístico es una de las técnicas más efectivas, reduciendo el spam entre un 80 y un 85% según hemos podido constatar. Cuando el sistema empieza a retroalimentarse gracias al aprendizaje bayesiano, el porcentaje de SPAM puede reducirse hasta un 90%.

Anterior Siguiente
Copyright © 2003 Interbel Software S) -C/ Marie Curie s/n Barcelona 08042 Tel. 93 291 76 76 . Aviso Legal. Web creada por FORMA Disseny