Un modelo de clasificaci贸n de Machine Learning es aquel que predice una variable 鈥測鈥 que es categ贸rica como, por ejemplo, si un empleado dejar谩 la organizaci贸n o se quedar谩, si un paciente tiene c谩ncer o no o si un cliente pagar谩 o incumplir谩 un pr茅stamo.

La Matriz de Confusi贸n es una de las m茅tricas m谩s intuitivas y sencillas que se utiliza para encontrar la precisi贸n y exactitud del modelo. Se utiliza para el problema de clasificaci贸n donde la salida puede ser de dos o m谩s tipos de clases.

matriz de confusio虂n 1

aprende f谩cilmente inteligencia artificial - newsletter

Expliquemos esto con un ejemplo, digamos que estamos resolviendo un problema de clasificaci贸n en el que predecimos si una persona tiene c谩ncer o no. D茅mosle una etiqueta a nuestra variable objetivo:

1 鈥 cuando una persona tiene c谩ncer,聽0 鈥 cuando una persona NO tiene c谩ncer.

Ya que hemos identificado el problema, la Matriz de confusi贸n, es una tabla con dos dimensiones, 鈥淎ctual鈥 y 鈥淧redicci贸n鈥, y conjuntos de clases en ambas dimensiones. Las filas de la matriz indican la clase observada o real y las columnas indican la clase predicha.

MATRIZ-BLOG-2

Tienes que tener en cuenta que la Matriz de Confusi贸n en s铆 misma no es una medida de rendimiento como tal, pero casi todas las m茅tricas de rendimiento se basan en ella y en los n煤meros que contiene.

A continuaci贸n, definimos varios t茅rminos que est谩n asociados con la Matriz de Confusi贸n:

Verdaderos Positivos (True Positives – TP)

Son los casos en los que los datos reales son 1 (Verdadero) y la predicci贸n tambi茅n es 1 (Verdadero).

Para nuestro ejemplo, si con los datos reales una persona tiene c谩ncer (1) y el modelo predice tambi茅n que tiene c谩ncer (1).

matriz de confusio虂n 2

Verdaderos Negativos (True Negatives – TN)

Son los casos en los que los datos reales con 0 (Falso) y el pron贸stico tambi茅n es 0 (Falso).

Para nuestro ejemplo, si con los datos reales una persona NO tiene c谩ncer (0) y el modelo predice tambi茅n que NO tiene c谩ncer (0).

matriz de confusio虂n 3

Falsos Positivos (False Positives – FP)

Son los casos en que los datos reales indica que es 0 (Falso) y la predicci贸n indica que es 1 (Verdadero), es decir la predicci贸n ha sido err贸nea. La palabra Falso es porque el modelo ha pronosticado incorrectamente y positivo porque la predicci贸n ha sido positiva (1).

Utilizando nuestro ejemplo: una persona que NO tiene c谩ncer el modelo predice que para su caso si tiene c谩ncer.

matriz de confusio虂n 4

Falsos Negativos (False Negatives – FN)

Son los casos en que los datos reales indica que es 1 (Verdadero) y el pron贸stico es 0 (Falso), ocasionando que la predicci贸n ha sido incorrecta. La palabra Falso es porque el modelo ha predicho incorrectamente y negativo porque predijo que era negativa (0).

Para nuestro ejemplo, una persona que tiene c谩ncer y el modelo predice que NO tiene c谩ncer.

matriz de confusio虂n 5

El escenario ideal que todos queremos es que el modelo d茅 0 falsos positivos y 0 falsos negativos, pero ese no es el caso en la vida real, ya que cualquier modelo NO ser谩 100% preciso en la mayor铆a de los casos.

MATRIZ-BLOG-7

3 comentarios en “Matriz de Confusi贸n”

Deja un comentario

Tu direcci贸n de correo electr贸nico no ser谩 publicada.