Machine Learning ya no es solo un subcampo de la informática, los gigantes de la tecnología lo han usado durante años, en las recomendaciones de productos de Amazon, Google Maps y el contenido de Facebook, Instagram y Twitter muestran en las redes sociales.
Las empresas promedio enfrentan muchos desafíos para comenzar a utilizar Machine Learning, y en ocasiones esto se debe a que no saben cómo exactamente funciona, por esta razón vamos a revisar acá cómo funciona Machine Learning. Veamoslo como un flujo de trabajo en donde se deben cumplir cada una de las etapas.
Definir el Objetivo
Lo primero que debes realizar es seleccionar el objetivo, qué es lo que quieres lograr con Machine Learning. Para esto se debe ser lo más objetivo posible de acuerdo las características de tu empresa o requerimiento así como también la información que puedes conseguir.
Por ejemplo si eres una empresa que vende por internet, de repente tu objetivo sería aumentar las ventas, pero acá caemos en un objetivo muy general, porque para lograrlo podemos utilizar muchos mecanismos que no requieren Machine Learning, como por ejemplo reducir los precios, crear promociones, entre otros. Para este caso es recomendable reajustar el objetivo y pensar un poco en cómo podemos lograr más ventas y de aquí surge un nuevo objetivo que sería recomendar a nuestros clientes productos específicos de acuerdo a las compras realizadas o las páginas visitadas en nuestra tienda online, acá el objetivo esta mejor estructurado y precisamente con este podemos implementar Machine Learning.
A veces definir un objetivo no están fácil o evidente, por lo que en ocasiones es en este paso en donde se lleva gran parte de nuestro tiempo.
Recolectar la data
Ahora que tenemos nuestro objetivo bien definido procedemos a recolectar la data que vamos a utilizar para nuestro algoritmo. En ocasiones este paso es relativamente fácil, ya que probablemente esta data ya la tengamos disponible, pero si por el contrario no la tienes ahora tendrás que ver cómo recolectarla y sobretodo esperar un tiempo prudencial para poder obtener suficiente y utilizarla con Machine Learning.
Acá lo importante es recolectar la información adecuada, porque no toda la data es útil para manipularla, por ejemplo si continuamos con el ejemplo de la tienda de ventas por internet, acá es importante recolectar la data de las páginas visitas, el tiempo que estuvo observando la información que contenía, así como también si en algún momento coloco el producto en el carrito de compra pero posteriormente se arrepintió en comprarlo, información como esta es la importante recolectar.
Preparar la data
Ya que hemos recogido todo la data que hemos podido, llega el momento de prepararla, a este paso normalmente se le conoce como preprocesamiento de datos, y es fundamental para cualquier análisis de Machine Learning, es en este punto en donde limpiamos los datos, la formateamos para que este acorde al algoritmo a utilizar.
En este proceso también podemos verificar si necesitamos más datos o si por el contrario debemos desechar alguno porque no es necesario o no esta recolectado correctamente. Este paso es muy importante y no se debe saltar en ningún momento.
Seleccionar el algoritmo
De acuerdo a la data ya preprocesada podemos definir que algoritmo es el más adecuado implementar, si un algoritmo de aprendizaje supervisado o por el contrario uno de aprendizaje no supervisado.
Para este selección debemos evaluar el objetivo que definimos y los datos que tenemos disponible y de acuerdo a esto definir el algoritmo adecuado.
Por ejemplo para nuestro ejemplo, vamos a utilizar algoritmos de aprendizaje no supervisado, ya que al final queremos un conjunto de productos que le podemos recomendar a cada uno de nuestros clientes, por lo que los agruparemos de acuerdo a las páginas visitadas en la tienda online.
Entrenar el modelo
Seleccionado el algoritmo a implementar iniciamos el proceso de entrenamiento del modelo con la data ya preprocesada, la cual se divide en dos una parte se utiliza para entrenar el modelo y la otra la usamos posteriormente para evaluarlo.
Acá se ingresa toda la información necesaria que requiere y poderlo ajustar para obtener resultados satisfactorios y que cumplan con nuestro objetivo definido en un principio.
Evaluar el modelo
Una vez entrenado el modelo procedemos a evaluarlo, acá se ingresa la data que no utilizamos anteriormente y evaluamos los resultados obtenidos.
En este punto es probable que el resultado obtenido no sea adecuado e inclusive completamente erróneo por lo que se deba devolver al punto anterior de entrenamiento del modelo y cambiar los ajustes ingresados acá. Estos dos etapas se pueden repetir tantas veces hasta que se encuentren resultados satisfactorios.
Realizar predicción
Una vez que obtenido un modelo adecuado y con el que hayamos obtenido resultados satisfactorio ya podemos implementarlo para poder realizar las predicciones, en este caso ya podemos ingresar data nueva al modelo y obtener resultados adecuados.
En cualquier proyecto de Machine Learning debemos seguir cada uno de estos pasos para obtener resultados satisfactorios, si te saltas alguno de ellos tenlo por seguro que lo único que obtendrás son errores porque cada una de estas etapas se deben cumplir.
Excelente trabajo. Absolutamente claro y específico. Si desperdicios. Gracias Lidgi.
Muchas gracias Fernando, espero que estes aprendiendo con este contenido. Saludos.