Clasificación de documentos

De testwiki
Ir a la navegación Ir a la búsqueda

Se define como la tarea de asignar valores booleanos a cada par dj,ci pertenecientes a D×C, donde D es el dominio de los documentos y C={c1,...,cn} es una colección de categorías predefinidas. T (verdadero) indica archivar un documento dj bajo ci, mientras F (falso) indica no archivar dj bajo ci.

Entre las aplicaciones que encuentra la clasificación de documentos se tienen los filtros de correo electrónico (spam / no spam)

Las medidas de evaluación utilizadas en la clasificación de documentos son principalmente precisión, cobertura y F-1.[1]

Referencias

Plantilla:Listaref

Enlaces externos

Publicaciones:

  • Fabrizio Sebastiani. Machine learning in automated text categorization. ACM Computing Surveys, 34(1):1–47, 2002 Plantilla:Enlace roto

Plantilla:Control de autoridades