Aprendizaje Supervisado: Decision Tree Classification

Tabla de contenidos

machine learning seg煤n expertos

Definici贸n

脕rbol de decisi贸n聽o Decisi贸n Tree Classification es un tipo de algoritmo de aprendizaje supervisado que se utiliza principalmente en problemas de clasificaci贸n, aunque funciona para variables de entrada y salida categ贸ricas como continuas.

En esta t茅cnica, dividimos la data en dos o m谩s conjuntos homog茅neos basados en el diferenciador m谩s significativos en las variables de entrada. El聽谩rbol de decisi贸nidentifica la variable ms significativa y su valor que proporciona los mejores conjuntos homogneos de poblaci贸n. Todas las variables de entrada y todos los puntos de divisi贸n posibles se eval煤an y se elige la que tenga mejor resultado.

aprende f谩cilmente inteligencia artificial - newsletter

Los algoritmos de aprendizaje basados en 谩rbol se consideran uno de los mejores y m谩s utilizados m茅todos de aprendizaje supervisado. Los m茅todos basados en 谩rboles potencian modelos predictivos con alta precisi贸n, estabilidad y facilidad de interpretaci贸n. A diferencia de los modelos lineales, mapean bastante bien las relaciones no lineales.

Decision Tree Clasificacio虂n

algebra lineal en machine learning

Ventajas

Las ventajas que tiene este tipo de algoritmo son:

F谩cil de entender.聽La salida del 谩rbol de decisi贸n es muy f谩cil de entender, incluso para personas con antecedentes no anal铆ticos, no se requiere ning煤n conocimiento estad铆stico para leerlos e interpretarlos.

til en la exploraci贸n de datos.聽El 谩rbol de decisi贸n es una de las formas m谩s r谩pidas para identificar las variables m谩s significativas y la relaci贸n entre dos o m谩s. Con la ayuda de los 谩rboles de decisi贸n podemos crear nuevas variables o caracter铆sticas que tengan mejor poder para predecir la variable objetivo.

Se requiere menos limpieza de datos.聽Requiere menos limpieza de datos en comparaci贸n con algunas otras t茅cnicas de modelado. A su vez, no esta influenciado por los valores at铆picos y faltantes en la data.

El tipo de datos no es una restricci贸n.聽Puede manejar variables num茅ricas y categ贸ricas.

Mtodo no paramtrico.聽Es considerado un m茅todo no param茅trico, esto significa que los 谩rboles de decisi贸n no tienen suposiciones sobre la distribuci贸n del espacio y la estructura del clasificador.

Probabilidad en Machine learning

Desventajas

Ya vista las ventajas, ahora se deben mencionar las desventajas que posee este algoritmo:

Sobreajuste.聽Es una de las dificultades m谩s comunes que tiene este algoritmo, este problema se resuelve colocando restricciones en los par谩metros del modelo y eliminando ramas en el an谩lisis.

Los modelos basados en聽rboles no estn dise帽ados para funcionar con caractersticas muy dispersas.聽Cuando se trata de datos de entrada dispersos (por ejemplo, caracter铆sticas categ贸ricas con una gran dimensi贸n), podemos preprocesar las caracter铆sticas dispersas para generar estad铆sticas num茅ricas, o cambiar a un modelo lineal, que es m谩s adecuado para dichos escenarios.

pregunta aprendeia

Respuesta a la pregunta del video

Opci贸n 1:  Predecir si una persona puede vivir o morir en el hundimiento del Titanic tomando en cuenta la edad, sexo y ubicaci贸n de su cabina. Respuesta Correcta. Con este algoritmo se puede determinar si una persona puede vivir o morir el hundimiento del Titanic.

Opci贸n 2: Predecir el valor de una acci贸n de la bolsa de valores, utilizando los valores hist贸rico. Respuesta Incorrecta. Con este algoritmo no se puede predecir el valor de una acci贸n de la bolsa ya que para esto se requiere un algoritmo de regresi贸n y este es un algoritmo de clasificaci贸n.

Opci贸n 3: Predecir la distancia en que un auto se detiene de acuerdo a la velocidad del mismo. Respuesta Incorrecta. Con este algoritmo no se puede determinar la distancia en que un auto se puede detener, para ello se requiere un algoritmo de regresi贸n y este es de clasificaci贸n.

Si te llamo la atenci贸n todo este contenido y te animaste a empezar a estudiar Inteligencia Artificial, he desarrollado un curso que te ayudar谩, de igual forma a iniciar tu camino dentro de est谩 tecnolog铆a. Este curso te sentar谩 las bases y te dar谩 m谩s claridad para poder seleccionar el enfoque o 谩rea que m谩s te interese sobre la Inteligencia Artificial, de igual forma te ayudar谩 tener m谩s claridad en muchos conceptos que seguramente en estos momentos te parece confusos. Este curso es ideal si apenas est谩s empezando. Si quieres m谩s informaci贸n puedes ingresar a este enlace.

Deja un comentario

Tu direcci贸n de correo electr贸nico no ser谩 publicada.