3.
Filtro heurístico por puntuación
El método heurístico es el utilizado
por el famoso filtro Spam Assassin. Este método
considera un mensaje como correo basura si supera
una puntuación definida por el administrador.
El filtro de spam de MDaemon coloca esa puntuación
en función de unas reglas internas.
La técnica heurística paso a paso
Este método consiste en realizar una serie
de pruebas sobre cada mensaje, asignando puntuaciones
a cada prueba. Algunas de las pruebas que se hacen
consisten en comprobar el porcentaje de HTML del mensaje,
si contiene colores o palabras sospechosas como “sexo”
o “viagra”, o bien si contiene indicios
de un origen falsificado. También hay pruebas
que restan puntos, como haber sido aprobado por un
moderador de lista de correo, tener una firma PGP
o ser la respuesta a un mensaje.
Esta puntuación viene asignada por defecto,
aunque el sistema agrega nuevas puntuaciones según
el aprendizaje bayesiano se va retroalimentando.
El administrador predefine qué hacer cuando
un mensaje alcanza cierta puntuación. Ver en
el ejemplo:
Se aprecia que un mensaje será considerado
spam al alcanzar una puntuación de 0,5, un
valor muy restrictivo con el spam. Ese valor se puede
variar como se detalla en los ejemplos de las opciones
de Spam Filter, de la imagen de arriba. Cuando esto
suceda, el usuario verá lo siguiente:
La carpeta Spam irá recogiendo los mensajes
de correo basura que hayan alcanzado esa puntuación,
insertando una etiqueta que lo califica como SPAM
en el propio encabezado. La etiqueta de puntuación
es la que se podía ver en la primera imagen,
la definida en el campo Etiqueta del asunto. El resto
de mensajes no etiquetados como spam irán a
parar a la Bandeja de entrada como de costumbre.
En la ficha de las estadísticas del Correo
basura (pantalla principal del servidor MDaemon):
se aprecia en tiempo real cómo se puntúa
cada elemento de un mensaje (por ejemplo, mucho porcentaje
de HTML o la inserción del término “sex”
califican con más puntos). Al sumar la puntuaciones,
se compara con las opciones definidas por el administrador
a la hora de clasificar un mensaje como spam o rechazarlo
(ver la primera imagen).
El método heurístico es una de las
técnicas más efectivas, reduciendo el
spam entre un 80 y un 85% según hemos podido
constatar. Cuando el sistema empieza a retroalimentarse
gracias al aprendizaje bayesiano, el porcentaje de
SPAM puede reducirse hasta un 90%. |