Diferencia entre revisiones de «Clasificación de documentos»
Ir a la navegación
Ir a la búsqueda
imported>Jialxv m Reemplazos con Replacer: «e-mail» |
(Sin diferencias)
|
Revisión actual - 23:12 5 oct 2022
Se define como la tarea de asignar valores booleanos a cada par pertenecientes a , donde es el dominio de los documentos y es una colección de categorías predefinidas. T (verdadero) indica archivar un documento bajo , mientras F (falso) indica no archivar bajo .
Entre las aplicaciones que encuentra la clasificación de documentos se tienen los filtros de correo electrónico (spam / no spam)
Las medidas de evaluación utilizadas en la clasificación de documentos son principalmente precisión, cobertura y F-1.[1]
Referencias
Enlaces externos
Publicaciones:
- Fabrizio Sebastiani. Machine learning in automated text categorization. ACM Computing Surveys, 34(1):1–47, 2002 Plantilla:Enlace roto