Classificació automàtica

La classificació automàtica consisteix a fer que un programa informàtic ordeni elements per temes. Normalment es classifiquen documents, correus electrònics o altres elements que continguin paraules.

Per què serveix?

Una aplicació típica són els classificadors d'spam per al correu electrònic. Aquests sistemes són capaços d'identificar els correus electrònics que són correu brossa, de manera que després es poden separar amb facilitat.

Però aquests programes són capaços de classificar els documents en més de dues categories: es pot fer un sistema que classifiqui documents segons parlin d'esports, economia, política, tecnologia, cultura o societat o bé classificar factures per tipus, etc.

Per exemple, es poden classificar missatges d'usuaris indicant si és un missatge hostil, amable, elogiós, etc.

Com funciona?

En general (hi ha excepcions) aquests sistemes s'han d'entrenar amb exemples prèviament classificats. En aquest procés d'entrenament el sistema aprèn les característiques de cada tema.

Un cop entrenat, el sistema aplica un o més d'un tema a cada nou document, normalment associant-li un nombre que indica la confiança que té en què aquesta classificació sigui correcta.

I amb aquest resultat, què es fa?

Les possibilitats són grans:

  • Enrutar els documents a personal especialitzat (per exemple: enviar al Miquel les notícies d'esports i a la Maria les de política).
  • Donar prioritat alta a missatges d'usuaris hostils o amb reclamacions.
  • Organitzar automàticament un cunjunt de documentació per categories.
  • Cercar documents similars a un altre.

Segur que se t'acudeixen més coses...