Clasificación automática

La clasificación automática consiste en hacer que un programa informático ordene elementos por temas. Normalmente se clasifican documentos, e-mails u otros elementos que contengan palabras.

¿Para qué sirve?

Una aplicación típica son los clasificadores de spam para el correo electrónico. Estos sistemas son capaces de identificar los e-mails que son spam, con lo que luego pueden separarse fácilmente.

Pero estos programas son capaces de clasificar los documentos en más de dos categorías: se puede hacer un sistema que clasifique documentos según hablen de deportes, economía, política, tecnología, cultura o sociedad o bien clasificar facturas por tipos, etc.

Se puede, por ejemplo, clasificar mensajes de usuarios, indicando si es un mensaje hostil, amable, elogioso, etc.

¿Cómo funciona?

En general (hay excepciones) estos sistemas deben entrenarse con ejemplos previamente clasificados. En este proceso de entramiento el sistema aprende las características de cada tema.

Una vez entrenado, el sistema aplica un tema o más de uno a cada nuevo documento, normalmente asociándole un número que indica la confianza que tiene en que esa clasificación sea correcta.

Y con ese resultado, ¿qué se hace?

Las posibilidades son grandes:

  • Enrutar los documentos a personal especializado (por ejemplo: enviar a Miguel las noticias de deportes y a Lucía las de política)
  • Dar prioridad alta a mensajes de usuarios hostiles o con reclamaciones
  • Organizar automáticamente un conjunto de documentación por categorías
  • Buscar documentos similares a otro

Seguro que se te ocurren más cosas...