Herramientas anti Spam III

Despues de trabajar unos dias con el antivirus de Antigen instalado, observamos una disminución importante en el volumen del spam recibido. Esta herramienta detiene prácticamente todo el correo basura que se le envía, únicamente es necesario de vez en cuando revisar los correos que se vayan almacenando en la carpeta de cuarentena, sospechosos de ser spam y determinar la acción de rechazo o de paso según vaya siendo necesario, con los leves ajustes a las listas de palabras cavles o lineas de asunto que se vayan encontrando en nuevos correos.

Existe, sin embargo un problema. Hay un tipo particular de spam, frente al cual esta herramienta no ha mostrado ninguna clase de efectividad. Son aquellos correos que vienen construidos de tal forma que los conforma una imagen (generalmente un archivo .gif) con el texto del spam y una serie de lineas de texto posterior, que no tienen absolutamente ningún sentido.
Investigando que es lo que sucede con estos, resulta que estos correos estan construidos así para engañar específicamente a los filtros anti spam. La segunda parte de los mismos, las líneas de texto, buscan confundir a los clasificadores bayesianos que tienen la mayoria de los filtros de spam, utilizando palabras y frases convencionales y de esta forma "contaminar" las reglas de eliminación de spam que van aprendiendo. La primera parte del correo, la imagen GIF tiene como objeto, al ser una imagen, impedir que las reglas (que son basadas en el análisis de los textos) puedan funcionar, dado que no son textos, si no imágenes.
Existen algunas herramientas anti spam que han detectado esto y emplean técnicas de OCR para analizar estas imágenes y obrar en consecuencia, pero hay más problemas. Si usted ha recibido uno de estos correos y lo observa detenidamente, podrá darse cuenta que alrededor del texto de la imagen hay pequeñas "imperfecciones", líneas, como si fueran basura, polvo, etc, cuyo único proposito es confundir a los análisis OCR (de una forma similar a como se emplean los "captchas"). Pero espere, aún hay más. Resulta que existe un tipo especial de archivos GIF, los llamados GIF animados, que muestran una secuencia de imágenes con una cierta velocidad y que con ellos simulan una animación, pues bien, los spamers echan mano de este recurso y construyen su archivo GIF de tal forma, que una imagen contenga una "mascara" donde se despliegan unos cuantos pixeles que forman el texto, en otra imagen, la mascara cambia y presenta otro juego de pixeles, y así sucesivamente con múltiples imágenes. Luego, hacen que se desplieguen una detras de la otra con una velocidad muy alta y lo que tenemos por resultado es una imagen con un texto perfectamente legible para los humanos dado el fenómeno de la persistencia de la visión, pero que los OCR no pueden ccmprender ya que ellos solo "ven" una serie de puntos sin ninguna significancia.
Para este tipo de spam, no existe por el momento filtro alguno, aún que hay algunos avances prometedores que emplean técnicas de análisis de imágenes que pueden llegar a interpretar estos mensajes.

Por lo visto nos encontramos metidos en una carrera armamentista, que los spammers van ganando por lo pronto y que solo nos depara en el cercano plazo, costos molestias y dificultades para poder emplear esta herramienta del correo electrónico, de manera efectíva y sin molestias.

0 comentarios: