El algoritmo聽 de Vectores de Soporte Regresi贸n聽se basa en buscar la curva o聽hiperplano聽que modele la tendencia de los datos de entrenamiento y seg煤n ella predecir cualquier dato en el futuro. No te preocupes, ya vas a entender mejor este concepto.

Este algoritmo se puede utilizar tanto para problemas de regresi贸n como de clasificaci贸n, para esta publicaci贸n nos enfocaremos a explicar el algoritmo de regresi贸n.

estad铆sticas en machine learning

Definici贸n

El algoritmo de Vectores de Soporte Regresi贸n se basa en predecir valores num茅ricos, dado que la salida es un n煤mero real, se vuelve muy dif铆cil predecir la informaci贸n disponible, que tiene infinitas posibilidades, sin embargo, la idea principal es siempre la misma: minimizar el error, individualizar el hiperplano que maximiza el margen, teniendo en cuenta que se tolera parte del error.

Support Vector Regression

El hiperplano que se obtiene dentro de este algoritmo siempre tratar谩 de moldear el comportamiento de los datos y esta curva siempre viene acompa帽ada con un rango (m谩ximo margen), tanto del lado positivo como en el negativo, el cual tiene el mismo comportamiento o forma de la curva.

Todos los datos que se encuentren fuera del rango son considerados errores por lo que es necesario calcular la distancia entre el mismo y los rangos. Esta distancia lleva por nombre epsilon y afecta la ecuaci贸n final del modelo.

aprender a programar para machine Learning

Representaci贸n matem谩tica de los vectores de soporte regresi贸n

Este algoritmo funciona muy bien para datos lineales como no lineales, pero realicemos la explicaci贸n con datos lineales para que sea m谩s f谩cil de entender. Entonces expliquemos paso a paso c贸mo se construye este algoritmo.

Tenemos el siguiente conjunto de datos, que, como podemos observar son datos lineales:

Vectores de Soporte Regresio虂n Teori虂a 1

Lo primero que debemos realizar es obtener un hiperplano que mejor represente el comportamiento de los datos, como el ejemplo que estamos usando son datos lineales este hiperplano es simplemente una l铆nea, pero cuando se trabaja con datos no lineales el hiperplano es mucho m谩s complicado a este. La f贸rmula para este hiperplano ser谩 la misma a la de una l铆nea:

Vectores de Soporte Regresio虂n Teori虂a 2

El siguiente paso es construir unas bandas paralelas al hiperplano que cubra la mayor cantidad de datos, a estas bandas se le conoce como vectores de apoyo o de soporte.

Vectores de Soporte Regresio虂n Teori虂a 3

Ahora bien, como podemos observar estas bandas no cubrieron todos los datos, todav铆a tenemos puntos fuera de la misma, estos datos ser铆an los errores y los que se deben considerar para la f贸rmula del algoritmo. Ac谩 lo que se calcula es la distancia entre las bandas y el punto, a esta distancia se le da el nombre de epsilon.

Al final la f贸rmula completa para el c谩lculo de este algoritmo, utilizando datos lineales es la siguiente:

Vectores de Soporte Regresio虂n Teori虂a 4

En donde:

w es la magnitud del vector o hiperplano

C es una constante y debe ser mayor a 0, determina el equilibrio entre la regularidad de la funci贸n y la cuant铆a hasta la cual toleramos desviaciones mayores que las bandas de soporte.

尉 y 尉* son las variables que controlan el error cometido por la funci贸n de regresi贸n al aproximar a las bandas.

Si el valor de la constante C es muy grande, en el caso l铆mite C tiende a infinito , estar铆amos considerando que el conjunto est谩 perfectamente representado por nuestro hiperplano predictor, 尉 tiende a 0. Al contrario, un n煤mero demasiado peque帽o para C permitir谩 valores de 尉 elevados, es decir, estar铆amos admitiendo un n煤mero muy elevado de ejemplos mal representados.

Por su parte para datos no lineales el procedimiento es exactamente igual, la diferencia es que se implementa de un Kernel para convertir los datos lineales. Sobre el Kernel hablaremos en otra entrada dedicado completamente explicar sobre todo lo referente a este tema. Ac谩 lo importante es mostrar es que una vez llegados estos datos de forma lineal el procedimiento explicado ac谩 es exactamente igual.

Vectores de Soporte Regresio虂n Teori虂a 5

historia de machine learning

Suposiciones sobre los Vectores de Soporte Regresi贸n

Como pudiste ver en la explicaci贸n los datos pueden ser lineales o no lineales, ya que al final el modelo se ajusta al comportamiento de los datos, lo importante es que se cumplan ciertos criterios para que el modelo obtenga resultados 贸ptimos. Algunos de los criterios que se deben considerar son los siguientes:

  • Los datos deben estar limpios, por lo que se deben preprocesar con anterioridad.
  • No es adecuado para conjuntos de datos grandes ya que el tiempo de entrenamiento puede ser alto.
  • No es tan efectivo en conjuntos de datos con clases superpuestas o caracter铆sticas muy similares.

Adicionalmente a esto, el rendimiento del algoritmo de Vectores de Soporte Regresi贸n depende de una buena configuraci贸n de los par谩metros C y de los del Kernel. El problema de la selecci贸n 贸ptima de par谩metros se complica a煤n m谩s por el hecho de que la complejidad del modelo de Vectores de Soporte Regresi贸n depende de estos par谩metros. Por tal motivo se debe usar librer铆as de programaci贸n que tenga muy bien desarrollados la implementaci贸n de este algoritmo como por ejemplo Scikit Learn.

pregunta aprendeia

Respuesta a la pregunta del video

Opci贸n 1:聽Predecir la temperatura de un lugar espec铆fico de acuerdo a los datos hist贸ricos. Respuesta Correcta.聽Con este algoritmo se puede predecir la temperatura de un sitio utilizando como variables independientes los datos hist贸ricos.

Opci贸n 2:聽Predecir si una acci贸n de la bolsa de valores va a subir o bajar, utilizando los valores hist贸rico. Respuesta Incorrecta.聽Con este algoritmo no se puede predecir si una acci贸n de la bolsa va a subir o bajar ya que para esto requiere un algoritmo de clasificaci贸n y no un algoritmo de regresi贸n.

Opci贸n 3:聽Predecir la distancia en que un auto se detiene de acuerdo a la velocidad del mismo. Respuesta Correcta.聽Con este algoritmo se puede calcular la distancia en que un auto se detiene, ac谩 se observa la velocidad del auto y las distancias recorridas para predecir el valor.

Si te llamo la atenci贸n todo este contenido y te animaste a empezar a estudiar Inteligencia Artificial, he desarrollado un curso que te ayudar谩, de igual forma a iniciar tu camino dentro de est谩 tecnolog铆a. Este curso te sentar谩 las bases y te dar谩 m谩s claridad para poder seleccionar el enfoque o 谩rea que m谩s te interese sobre la Inteligencia Artificial, de igual forma te ayudar谩 tener m谩s claridad en muchos conceptos que seguramente en estos momentos te parece confusos. Este curso es ideal si apenas est谩s empezando. Si quieres m谩s informaci贸n puedes ingresar a este enlace.

Deja un comentario

Tu direcci贸n de correo electr贸nico no ser谩 publicada.