Aunque un algoritmo no siempre ser谩 mejor que otro, hay algunas propiedades de cada algoritmo que podemos usar como gu铆a para seleccionar el correcto de forma r谩pida y para ajustar los par谩metros hiperactivos. Por lo tanto, la elecci贸n correcta del algoritmo a menudo permanece poco clara a menos que probemos nuestros algoritmos directamente a trav茅s de un simple ensayo y error.

proscontra 1

Curso Te贸rico-Pr谩ctico: Machine Learning para no programadores

En esta entrada ver谩s algunos algoritmos de Machine Learning para problemas de clasificaci贸n y podr谩s establecer las pautas para cuando usarlos seg煤n sus fortalezas y debilidades.

Regresi贸n Log铆stica

Definici贸n

aprende f谩cilmente inteligencia artificial - newsletter

La Regresi贸n Log铆stica es el an谩lisis de regresi贸n apropiado para realizar cuando la variable dependiente es binaria. Como todos los an谩lisis de regresi贸n, la regresi贸n log铆stica es un an谩lisis predictivo. Se utiliza para describir datos y explicar la relaci贸n entre una variable binaria dependiente y una o m谩s variables independientes nominales, ordinales, de intervalo o de nivel de raz贸n.

Ventajas

  • F谩cil de entender y explicar
  • Rara vez existe sobreajuste
  • El uso de la regularizaci贸n es efectivo en la selecci贸n de funciones.
  • R谩pido para entrenar.
  • F谩cil de entrenar sobre grandes datos gracias a su versi贸n estoc谩stica.

Desventajas

  • Tienes que trabajar duro para que se ajuste a los datos no lineales.
  • Puede sufrir con valores at铆picos.
  • En algunas ocasiones es muy simple para captar relaciones complejas entre variables.

Son 煤tiles

  • Ordenar los resultados por probabilidad
  • Modelado de respuestas de marketing

proscontra 2

K Vecinos m谩s Cercanos Clasificaci贸n

Definici贸n

K Vecinos m谩s cercanos es un algoritmo de Machine Learning muy simple, f谩cil de entender, vers谩til. Esta basado en la similitud de caracter铆sticas. Es un algoritmo no param茅trico que significa que no hace suposiciones para la distribuci贸n de datos subyacente. En otras palabras, la estructura modelo determinada a partir del set de datos. Es un algoritmo perezoso, es decir que no necesita puntos de datos de entrenamiento para la generaci贸n de modelos.

Ventajas

  • Simple
  • Potente
  • Entrenamiento r谩pido
  • Puede manejar naturalmente problemas extremos de multiclases, como etiquetado de texto.

Desventajas

  • Costoso y lento para predecir nuevas instancias.
  • Se debe definir una funci贸n de distancia significativa.
  • Funciona mal en conjuntos de datos de alta dimensionalidad.

Son 煤tiles

  • Conjuntos de datos de baja dimensi贸n
  • Visi贸n por computador
  • Seguridad inform谩tica: detecci贸n de intrusos
  • Detecci贸n de fallos en la fabricaci贸n de semiconductores
  • Sistema de recomendaci贸n
  • Problemas de correcci贸n ortogr谩fica
  • Recuperaci贸n de contenido de video

proscontra 3

M谩quines Vectores de Soporte Clasificaci贸n

Definci贸n

Se basa en la construcci贸n de un hiperplano 贸ptimo en forma de superficie de decisi贸n, de modo que el margen de separaci贸n entre las dos clases en los datos se ampl铆a al m谩ximo. Los vectores de soporte hacen referencia a un peque帽o subconjunto de las observaciones de entrenamiento que se utilizan como soporte para la ubicaci贸n 贸ptima de la superficie de decisi贸n.

Curso Te贸rico-Pr谩ctico:Generaci麓贸n de Texto con Inteligencia Artificial

Ventajas

  • Se pueden modelar relaciones complejas, no lineales.
  • Robusto al ruido, esto se debe a que maximizan los m谩rgenes.

Desventajas

  • Necesidad de seleccionar una buena funci贸n de kernel.
  • Los par谩metros del modelo son dif铆ciles de interpretar.
  • Requiere memoria significativa y poder de procesamiento.
  • Cuando se tiene muchos datos toma demasiado tiempo para entrenar.

Son 煤tiles

  • Clasificaci贸n de texto e im谩genes.
  • Reconocimiento de escritura a mano.

proscontra 4

Naive Bayes

Definici贸n

Un clasificador Naive Bayes es un modelo probabil铆stico de Machine Learning que se utiliza para las tareas de clasificaci贸n. Este algoritmo clasificador se basa en el teorema de Bayes.

Ventajas

  • F谩cil y r谩pido de implementar.
  • No requiere demasiada memoria y se puede utilizar para el aprendizaje en l铆nea.
  • F谩cil de entender.

Desventajas

  • Falla al estimar las caracter铆sticas raras.
  • Sufre al tener caracter铆sticas irrelevantes.

Son 煤tiles

  • Reconocimiento de rostros
  • An谩lisis de los sentimientos
  • Detecci贸n de spam
  • Clasificaci贸n de textos

proscontra 5

脕rboles de Decisi贸n Clasificaci贸n

Definici贸n

Dado un conjunto de datos se fabrican diagramas de construcci贸n l贸gicas, que sirven para representar y categorizar una serie de condiciones que ocurren de forma sucesiva, para la resoluci贸n de un problema.

Ventajas

  • Muy f谩cil de interpretar y entender.
  • R谩pido.
  • Robusto al ruido y valores perdidos.
  • Preciso
  • Excelente para aprender relaciones complejas, altamente no lineales. Por lo general, pueden lograr un rendimiento bastante alto.

Desventajas

  • Los 谩rboles complejos son dif铆ciles de interpretar.
  • Es posible la duplicaci贸n dentro del mismo sub谩rbol.
  • En ocasiones no es utilizado por ser un algoritmo tan sencillo y no tan poderoso para datos complejos.

Son 煤tiles

  • Diagn贸stico m茅dico.
  • An谩lisis de riesgo crediticio.

proscontra 6

Bosques Aleatorios Clasificaci贸n

Definici贸n

Es una combinaci贸n 谩rboles de decisi贸n tal que cada 谩rbol depende de los valores de un vectores aleatorio probado indpendientemente y con la misma distribuci贸n para cada uno de estos.

Ventajas

  • Puede trabajar en paralelo.
  • Rara vez se sobreajusta.
  • Maneja autom谩ticamente los valores perdidos.
  • No es necesario transformar ninguna variable.
  • No hay necesidad de ajustar par谩metros.
  • Puede ser utilizado por casi cualquier persona con excelentes resultados.

Desventajas

  • Dif铆cil de interpretar.
  • Parcialmente en problemas multiclase hacia clases m谩s frecuentes.

Son 煤tiles

  • Para casi cualquier problema de Machine Learning.
  • Bioinform谩tica.

proscontra 7

Estos son solo algunas ventajas de desventajas de los algoritmos de Machine Learning para clasificaci贸n, esta informaci贸n te puede ser bastante 煤til al momento de desarrollar tus proyectos.

Deja un comentario

Tu direcci贸n de correo electr贸nico no ser谩 publicada.