Evaluando el error en los modelos de regresi贸n

Tabla de contenidos

Con un modelo de regresi贸n, predecimos o estimamos el valor num茅rico de una cantidad desconocida, de acuerdo con unas caracter铆sticas dadas.聽La diferencia entre la predicci贸n y el valor real es el error, este es una variable aleatoria, que puede depender de las caracter铆sticas dadas.

En la actualidad hay algunas formas para estimar el rendimiento y evaluar el ajuste del modelo, algunas de ellas son: el error cuadr谩tico medio (RMSE, por sus siglas en ingl茅s, root mean squared error), error absoluto medio (MAE, mean absolute聽error), R-cuadrado.聽

aprende f谩cilmente inteligencia artificial - newsletter

Comencemos a explicar cada unas de ellas para entenderlas mejor.

Por que python para machine Learning

Error cuadr谩tico medio (RMSE)

La m茅trica m谩s com煤nmente utilizada para las tareas de regresi贸n es el error cuadr谩tico medio y representa a la ra铆z cuadrada de la distancia cuadrada promedio entre el valor real y el valor pronosticado.

Evaluando-el-error-en-los-modelos-de-regresio虂n-1

Indica el ajuste absoluto del modelo a los datos, cu谩n cerca est谩n los puntos de datos observados de los valores predichos del modelo. El error cuadratico medio o RMSE es una medida absoluta de ajuste.

Como la ra铆z cuadrada de una varianza, RMSE se puede interpretar como la desviaci贸n est谩ndar de la varianza inexplicada, y tiene la propiedad 煤til de estar en las mismas unidades que la variable de respuesta.

Los valores m谩s bajos de RMSE indican un mejor ajuste. RMSE es una buena medida de la precisi贸n con que el modelo predice la respuesta, y es el criterio m谩s importante para ajustar si el prop贸sito principal del modelo es la predicci贸n.

C贸mo funcionan los autos aut贸nomos

Error absoluto medio (MAE)

Evaluando-el-error-en-los-modelos-de-regresio虂n-2

Es el promedio de la diferencia absoluta entre el valor observado y los valores predichos. El error absoluto medio o MAE es un puntaje lineal, lo que significa que todas las diferencias individuales se ponder谩n por igual en el promedio. Por ejemplo, la diferencia entre 10 y 0 ser谩 el doble de la diferencia entre 5 y 0.

pregunta aprendeia

R2

R-cuadrado indica la bondad o la aptitud del modelo, a menudo se utiliza con fines descriptivos y muestra que tambi茅n las variables independientes seleccionadas explican la variabilidad en sus variables dependiente. R2 se define como:

Evaluando-el-error-en-los-modelos-de-regresio虂n-3

R-cuadrado tiene la propiedad 煤til de que su escala es intuitiva, va de 0 a 1, con 0 indicando que el modelo propuesto no mejora la predicci贸n sobre el modelo medio y 1 indica una predicci贸n perfecta. La mejora en el modelo de regresi贸n da como resultado aumentos proporcionales en R-cuadrado.

Una de las dificultades de R-cuadrado es que solo puede aumentar a medida que se agregan predictores al modelo de regresi贸n. Este aumento es artificial cuando los predictores no mejoran el ajuste del modelo. Para remediar esto, una estad铆stica relacionada es R-cuadrado ajustado, incorpora los grados de libertad del modelo. El R-cuadrado ajustado disminuir谩 a medida que agreguen predictores si el aumento en el ajuste del modelo no compensa la p茅rdidas de grados de libertad. Asimismo, aumentar谩 a medida que se agreguen predictores si vale la pena el aumento en el ajuste del modelo. El R-cuadrado ajustado siempre se debe usar con modelos con m谩s de una variable de predicci贸n. Se interpreta como la proporci贸n de la varianza total que se explica por el modelo.

algebra lineal en machine learning

Limitaciones importante de RMSE y MAE

Cada una de estas medidas es meramente un promedio o la ra铆z cuadrada de ese promedio de las realizaciones de los errores de prueba. El error es una variable aleatoria num茅rica y no se puede captar todo el comportamiento de una variable aleatoria con una sola agregaci贸n de observaciones. El error es solo una variable aleatoria, a menudo es una variable aleatoria muy sesgada. Cuando predecimos resultados sesgados, como precios, ingresos, ventas de art铆culos y muchos m谩s, lo m谩s probable es que el error tambi茅n sea sesgado, lo que significa que en la mayor铆a de los casos el error es muy peque帽o, pero hay relativamente pocos ejemplos que pueden tener errores extremadamente grandes. Cuando el error es muy sesgado, el promedio a menudo no dice nada.

por que虂 programar es tan dificil

R-cuadrado ajustado sobre R-cuadrado

Hay algunos problemas con R-cuadrado que se resuelven con R-cuadrado ajustado. Un R-cuadrado ajustado considerar谩 la mejora marginal agregada por un t茅rmino adicional en el modelo. Por lo tanto, aumentar谩 si agrega los t茅rminos 煤tiles y disminuir谩 si agrega predictores menos 煤tiles. Sin embargo, R-cuadrado aumenta con el aumento de los t茅rminos a pesar de que el modelo en realidad no est谩 mejorando.

La mejor medida del ajuste del modelo depende de los objetivos del desarrollado, y m谩s de uno a menudo es 煤til. Tienes que tomar en cuando que las formas de evaluaci贸n discutidas anteriormente son aplicables a los modelos de regresi贸n.

Si te llamo la atenci贸n todo este contenido y te animaste a empezar a estudiar Inteligencia Artificial, he desarrollado un curso que te ayudar谩, de igual forma a iniciar tu camino dentro de est谩 tecnolog铆a. Este curso te sentar谩 las bases y te dar谩 m谩s claridad para poder seleccionar el enfoque o 谩rea que m谩s te interese sobre la Inteligencia Artificial, de igual forma te ayudar谩 tener m谩s claridad en muchos conceptos que seguramente en estos momentos te parece confusos. Este curso es ideal si apenas est谩s empezando. Si quieres m谩s informaci贸n puedes ingresar a este enlace.

3 comentarios en “Evaluando el error en los modelos de regresi贸n”

  1. El aprendizaje por refuerzo se centra en los procesos de aprendizajes reglamentados, en los que se proporcionan algoritmos de aprendizaje automaticos con un conjunto de acciones, parametros y valores finales. En consecuencia, este sistema ensena la maquina a traves del proceso de ensayo y error. Aprende de experiencias pasadas y comienza a adaptar su enfoque en respuesta a la situacion para lograr el mejor resultado posible.

Deja un comentario

Tu direcci贸n de correo electr贸nico no ser谩 publicada.