Los Bosques Aleatorios es un algoritmo de Machine Learning flexible y f谩cil de usar que produce, incluso sin ajuste de par谩metros, un gran resultado la mayor parte del tiempo. Tambi茅n es uno de los algoritmos m谩s utilizados, debido a su simplicidad y al hecho de que se puede usar tanto para tareas de clasificaci贸n como de regresi贸n.

estad铆sticas en machine learning

Definici贸n

Los Bosques Aleatorios es un algoritmo de聽aprendizaje supervisado聽que, como ya se puede ver en su nombre, crea un bosque y lo hace de alguna manera aleatorio. Para decirlo en palabras simples: el Bosque Aleatorio crea m煤ltiples聽谩rboles de decisi贸n聽y los combina para obtener una predicci贸n m谩s precisa y estable. En general, mientras m谩s 谩rboles en el bosque se vea, m谩s robusto es el bosque. Random Forest Regression 1 En este algoritmo se agrega aleatoriedad adicional al modelo, mientras crece los 谩rboles, en lugar de buscar la caracter铆stica m谩s importante al dividir un nodo, busca la mejor caracter铆stica entre un subconjunto aleatorio de caracter铆sticas. Esto da como resultado una amplia diversidad que generalmente resulta en un mejor modelo. Por lo tanto, en Bosques Aleatorios, el algoritmo para dividir un nodo s贸lo tiene en cuenta un subconjunto aleatorio de las caracter铆sticas. Incluso puede hacer que los 谩rboles sean m谩s aleatorios, mediante el uso adicional de umbrales aleatorios para cada funci贸n en lugar de buscar los mejores umbrales posibles, como lo hace un 谩rbol de decisi贸n normal. Random Forest Regression 2
aprender a programar para machine Learning

Diferencia entre 脕rboles de Decisi贸n y Bosques Aleatorios

Como ya se mencion贸 anteriormente, los Bosques Aleatorios es una colecci贸n de 脕rboles de Decisi贸n, pero existe varias diferencias entre uno y el otro.

Si se ingresa un conjunto de datos de entrenamiento con caracter铆sticas y etiquetas en un 谩rbol de decisi贸n, formular谩 un conjunto de reglas, que se utilizar谩n para hacer las predicciones.

Por ejemplo, si deseas predecir si una persona har谩 clic en un anuncio en l铆nea, puedes recopilar informaci贸n sobre el anuncio, la persona que hizo clic en el pasado y algunas caracter铆sticas que describen su decisi贸n. Si colocamos estas caracter铆sticas en un 脕rbol de Decisi贸n, generar谩 algunas reglas para luego predecir si se har谩 clic en el anuncio o no. Por su parte un Bosque Aleatorio selecciona al azar las observaciones y caracter铆sticas para construir varios 脕rboles de Decisi贸n y luego promedia los resultados.

Otra diferencia es que cuando los 脕rboles de Decisi贸n son muy profundos pueden sufrir de sobreajuste. Por su parte los Bosques Aleatorios evita el exceso de adaptaci贸n la mayor parte del tiempo, creando subconjuntos aleatorios de las caracter铆sticas y construyendo 谩rboles m谩s peque帽os utilizando estos subconjuntos, posteriormente combina los sub谩rboles. Ten en cuenta que esto no funciona todas las veces y que tambi茅n hace que el c谩lculo sea m谩s lento, dependiendo de cu谩ntos 谩rboles genere el bosque al azar.

algebra lineal en machine learning

Ventajas

Las ventajas que tiene este algoritmo son las siguientes:

  • Puede resolver ambos tipos de problemas, es decir, clasificaci贸n y regresi贸n, y realiza una estimaci贸n decente en ambos frentes.
  • Unos de los beneficios que m谩s llama la atenci贸n es el poder de manejar grandes cantidades de datos con mayor dimensionalidad. Puede manejar miles de variables de entrada e identificar las variables m谩s significativas, por lo que se considera uno de los m茅todos de reducci贸n de dimensionalidad. Adem谩s el modelo muestra la importancia de la variable, que puede ser una caracter铆stica muy 煤til.
  • Tiene un m茅todo efectivo para estimar datos faltantes y mantiene la precisi贸n cuando falta una gran proporci贸n de los datos.
Probabilidad en Machine learning

Desventajas

A su vez las desventajas que tiene este algoritmo son las siguientes:

  • Hace un buen trabajo en la clasificaci贸n, pero no es tanto bueno como para los problemas de regresi贸n, ya que no proporciona predicciones precisas y continuas sobre la naturaleza. En caso de regresi贸n, no predice m谩s all谩 del rango en los datos de entrenamiento, y que pueden sobre ajustar los conjuntos de datos que son particularmente ruidosos.
  • En ocasiones se puede parecer este algoritmo como una caja negra, ya que se tiene muy poco control sobre lo que hace el modelo. Puedes, en el mejor de los casos, probar diferentes par谩metros y datos aleatorios.

Los Bosques Aleatorios es un gran algoritmo para entrenar temprano en el proceso de desarrollo del modelo, para ver c贸mo se desempe帽a y es dif铆cil construir un mal modelo con este algoritmo debido a su simplicidad. Es una excelente opci贸n, si necesita desarrollar un modelo en un corto periodo de tiempo, adem谩s de eso, proporciona un buen indicador de la importancia que asigna a sus caracter铆sticas.

pregunta aprendeia

Respuesta a la pregunta del video

Opci贸n 1:聽Predecir la enfermedad de un paciente tomando en cuenta los s铆ntomas que presenta. Respuesta Incorrecta.聽Con este algoritmo no se puede predecir la enfermedad de un paciente para esto se requiere de un algoritmo de clasificaci贸n y este es un algoritmo de regresi贸n.

Opci贸n 2:聽Predecir el precio de una acci贸n de la bolsa de valores, tomando en cuanta los datos hist贸ricos. Respuesta Correcta.聽Con este algoritmo se puede predecir si una acci贸n de la bolsa el precio de una acci贸n tomando como variables independientes los datos hist贸ricos.

Opci贸n 3:聽Predecir si una persona puede vivir o morir en el hundimiento del Titanic tomando en cuenta la edad, sexo y ubicaci贸n de su cabina. Respuesta Incorrecta.聽Con este algoritmo no se puede determinar si una persona puede vivir o morir el hundimiento del Titanic, ya que para ello se requiere utilizar un algoritmo de clasificaci贸n y este es un algoritmo de regresi贸n.

Si te llamo la atenci贸n todo este contenido y te animaste a empezar a estudiar Inteligencia Artificial, he desarrollado un curso que te ayudar谩, de igual forma a iniciar tu camino dentro de est谩 tecnolog铆a. Este curso te sentar谩 las bases y te dar谩 m谩s claridad para poder seleccionar el enfoque o 谩rea que m谩s te interese sobre la Inteligencia Artificial, de igual forma te ayudar谩 tener m谩s claridad en muchos conceptos que seguramente en estos momentos te parece confusos. Este curso es ideal si apenas est谩s empezando. Si quieres m谩s informaci贸n puedes ingresar a este enlace.

Deja un comentario

Tu direcci贸n de correo electr贸nico no ser谩 publicada.