Uno de los problemas típicos cuando se tiene un weblog y se que los visitantes escriban comentarios es el SPAM. Si sois lectores habituales de este blog, habreis visto que en muchas ocasiones aparecen comentarios en las cuales aparece unicamente SPAM. Este SPAM se produce mediante bots que van recorriendo la web buscando formularios y en ellos introducen automaticamente el texto y lo envian, por tanto no hace falta una persona física para realizar esta acción.
¿Qué se puede hacer para evitarlo? La técnica que se usa en los e-mails es crear filtros que analizan el e-mail y si encuentran texto que está en una BDD con textos comunes del SPAM, lo clasifican como SPAM y no se ve el e-mail. Esto sería lo más idóneo, crear filtros y listo, pero en un blog funciona la cosa de forma diferente y es dificil aplicarlo. Una técnica que se ve en muchos blogs es la de incluir un código de verificación al lado del formulario del comentario. Ese código se muestra en una imagen. Aquí es donde entra en juego un sistema que se llama CAPTCHA que viene a ser un acrónimo de Completely Automated Public Turing test to tell Computers and Humans Apart (Prueba de Turing pública y automática para diferenciar a máquinas y humanos). Dado que un ordenador no es capaz de reconocer imágenes (exceptuando software de reconocimiento facial y programas OCR) un bot es incapaz de leer el código que aparece en la imagen, por tanto no puede adivinar el código de verificación. Esta técnica también lo usan muchos servicios de internet para evitar que se crean cuentas anónimas con el fin de producir SPAM. Es un sistema muy simple y bastante eficaz, aunque tiene ciertas desventajas:
- Es molesto para el usuario, ya que tan sólo quiere meter un comentario y tiene que realizar un paso que en teoría debería ser innecesario.
- Al utilizar este sistema está evitando que personas con discapacidad puedan comentar, ya que los programas de reconocimiento de texto no pueden leerlo.
- Si un bot usa un programa OCR (Reconocimiento óptico de carácteres) típicos que suelen venir con los escáneres para leer documentos de texto que pasan por el escaner este sistema no sería válido, a menos que el código sea mostrado con unos carácteres no comunes.
Dado que ultimamente he estado recibiendo mucho spam en los comentarios, he decidido aplicar este sistema a los comentarios del blog. De momento seguirá tal como está, pero estoy trabajando también para hacer un ssitema que compruebe si es un usuario habitual el que comenta, este entre en una lista de usuarios [dquote]aceptados[dquote] y no tenga que introducir el código cada vez que comenta. Pero tiempo al tiempo. Disculpad las molestias, pero es un recurso que debo usar para evitar el spam.
Saludos y feliz navidad :)
