Una matriz de confusión es una técnica de medición de rendimiento para la clasificación de aprendizaje automático. Es una especie de tabla que te ayuda a conocer el rendimiento del modelo de clasificación en un conjunto de datos de prueba para el que se conocen los valores reales. El término «matriz de confusión» en sí es muy sencillo, pero su terminología relacionada puede ser un poco confusa. Aquí se da una explicación simple para esta técnica.
En este tutorial, aprenderás:
La matriz de confusión visualiza la precisión de un clasificador comparando las clases reales y predichas. La matriz de confusión binaria está compuesta por cuadrados:
Puedes calcular la prueba de precisión a partir de la matriz de confusión:
La matriz de confusión es un método útil de aprendizaje automático que te permite medir la precisión, precisión, exactitud y la curva AUC-ROC. A continuación se muestra un ejemplo para conocer los términos verdadero positivo, verdadero negativo, falso negativo y verdadero negativo.
Verdadero positivo:
Proyectaste un positivo y resultó ser cierto. Por ejemplo, habías predicho que Francia ganaría la copa del mundo, y lo hizo.
Verdadero negativo:
Cuando predijiste negativo, y es cierto. Predijiste que Inglaterra no ganaría y perdió.
Falso positivo:
Tu predicción es positiva, y es falsa.
Habías predicho que Inglaterra ganaría, pero perdió.
Falso negativo:
Tu predicción es negativa, y el resultado también es falso.
Habías predicho que Francia no ganaría, pero lo hizo.
Debes recordar que describimos los valores predichos como verdaderos o falsos o positivos y negativos.
Aquí tienes un proceso paso a paso para calcular una matriz de confusión en la minería de datos
Después de eso, estos números se organizan en los métodos dados a continuación:
La puntuación máxima es 1 cuando el clasificador clasifica perfectamente todos los valores positivos. La precisión por sí sola no es muy útil porque ignora la clase negativa. La métrica suele estar emparejada con la métrica de recuerdo. El recuerdo también se llama sensibilidad o tasa de verdaderos positivos.
Aquí tienes los pros/beneficios de usar una matriz de confusión.
Calle Eloy Gonzalo, 27
Madrid, Madrid.
Código Postal 28010
Paseo de la Reforma 26
Colonia Juárez, Cuauhtémoc
Ciudad de México 06600
Real Cariari
Autopista General Cañas,
San José, SJ 40104
Av. Jorge Basadre 349
San Isidro
Lima, LIM 15073