Aprendizaje Supervisado: Random Forest Regression

El algoritmo de bosque aleatorio o Random Forest Regressi贸n es un algoritmo de clasificaci贸n supervisado. Como su nombre lo sugiere, este algoritmo crea el bosque con varios 谩rboles.

En general, cuantos m谩s 谩rboles haya en el bosque, m谩s robusto ser谩 el bosque. Del mismo modo, en el clasificador aleatorio de bosques, cuanto mayor sea el n煤mero de 谩rboles en el bosque, mayor ser谩 la precisi贸n.

Aprendizaje Supervisado: Random Forest Regression

Una vez calculado cada 谩rbol de decisi贸n, el resultado de cada uno de ellos se promedian y con este se obtiene la predicci贸n del problema.

Las ventajas que tiene este algoritmo son las siguientes:

  • Puede resolver ambos tipos de problemas, es decir, clasificaci贸n y regresi贸n, y realiza una estimaci贸n decente en ambos frentes.
  • Unos de los beneficios que m谩s llama la atenci贸n es el poder de manejar grandes cantidades de datos con mayor dimensionalidad. Puede manejar miles de variables de entrada e identificar las variables m谩s significativas, por lo que se considera uno de los m茅todos de reducci贸n de dimensionalidad. Adem谩s el modelo muestra la importancia de la variable, que puede ser una caracter铆stica muy 煤til.
  • Tiene un m茅todo efectivo para estimar datos faltantes y mantiene la precisi贸n cuando falta una gran proporci贸n de los datos.

A su vez las desventajas que tiene este algoritmo son las siguientes:

  • Hace un buen trabajo en la clasificaci贸n, pero no es tanto bueno como para los problemas de regresi贸n, ya que no proporciona predicciones precisas y continuas sobre la naturaleza. En caso de regresi贸n, no predice m谩s all谩 del rango en los datos de entrenamiento, y que pueden sobreajustar los conjuntos de datos que son particularmente ruidosos.
  • En ocasiones se puede parecer este algoritmo como una caja negra, ya que se tiene muy poco control sobre lo que hace el modelo. Puedes, en el mejor de los casos, probar diferentes par谩metros y datos aleatorios.

Aprendizaje Supervisado: Random Forest Regression

Respuesta a la pregunta del video: 驴Cu谩l de los siguientes ejemplos podemos aplicar el algoritmo de聽random forest regression?

Opci贸n 1:聽Predecir la enfermedad de un paciente tomando en cuenta los s铆ntomas que presenta. Respuesta Incorrecta.聽Con este algoritmo no se puede predecir la enfermedad de un paciente para esto se requiere de un algoritmo de clasificaci贸n y este es un algoritmo de regresi贸n.

Opci贸n 2:聽Predecir el precio de una acci贸n de la bolsa de valores, tomando en cuanta los datos hist贸ricos. Respuesta Correcta.聽Con este algoritmo se puede predecir si una acci贸n de la bolsa el precio de una acci贸n tomando como variables independientes los datos hist贸ricos.

Opci贸n 3:聽Predecir si una persona puede vivir o morir en el hundimiento del Titanic tomando en cuenta la edad, sexo y ubicaci贸n de su cabina. Respuesta Incorrecta. Con este algoritmo no se puede determinar si una persona puede vivir o morir el hundimiento del Titanic, ya que para ello se requiere utilizar un algoritmo de clasificaci贸n y este es un algoritmo de regresi贸n.

Deja un comentario

Tu direcci贸n de correo electr贸nico no ser谩 publicada. Los campos obligatorios est谩n marcados con *