Machine Learning tiene varias clasificaciones, como ya explicamos anteriormente en el aprendizaje supervisado realizamos predicciones utilizando ejemplos etiquetados, es decir el entrenamiento del modelo se realiza con datos en donde se conoce el resultado. Por su parte, en el aprendizaje no supervisado, las variables de entrada se proporcionan sin etiquetas de salida, pero expliquemos m谩s esto.

Algoritmos de aprendizaje no suspervisado 1

Curso Te贸rico-Pr谩ctico: Machine Learning para no programadores

En el aprendizaje no supervisado, un algoritmo segrega los datos en un conjunto de datos en el que no est谩n etiquetados en funci贸n de algunas caracter铆sticas ocultas en los datos. Esta funci贸n puede ser 煤til para descubrir la estructura oculta de los datos y para tareas como la detecci贸n de anomal铆as.

aprende f谩cilmente inteligencia artificial - newsletter

Los algoritmos de aprendizaje no supervisados agrupan los datos en un conjunto de datos sin etiquetas en funci贸n de las caracter铆sticas ocultas subyacentes en los datos. Debido a que no hay etiquetas, no hay forma de evaluar el resultado, una diferencia clave entre los algoritmos de aprendizaje supervisado. Al agrupar datos a trav茅s del aprendizaje no supervisado, aprendes algo acerca de los datos en bruto que, de otro modo, no ser铆an visibles, en conjuntos de datos de grandes dimensiones, este problema es a煤n m谩s pronunciado.

Clasificaci贸n de aprendizaje no supervisado

El aprendizaje no supervisado se puede clasificar en dos categor铆as:

Aprendizaje no supervisado param茅trico

En este caso, suponemos una distribuci贸n param茅trica de datos. Supone que los datos de muestra provienen de una poblaci贸n que sigue una distribuci贸n de probabilidad basada en un conjunto fijo de par谩metros. Te贸ricamente, en una familia normal de distribuciones, todos los miembros tienen la misma forma y est谩n parametrizados por la media y la desviaci贸n est谩ndar, eso significa que, si conoce el promedio y la desviaci贸n est谩ndar y que la distribuci贸n es normal, conoce la probabilidad de cualquier observaci贸n futura. El aprendizaje no supervisado param茅trico implica la construcci贸n de modelos de mezclas gaussianas y el uso del algoritmo de maximizaci贸n de expectativas para predecir la clase de la muestra en cuesti贸n. Este caso es mucho m谩s dif铆cil que el aprendizaje supervisado est谩ndar porque no hay etiquetas de respuesta disponibles y, por lo tanto, no hay una medida exacta de precisi贸n disponible para verificar el resultado.

Aprendizaje no supervisado no param茅trico

En esta versi贸n, los datos se agrupan en grupos, donde cada grupo dice algo acerca de las categor铆as y clases presentes en los datos. Este m茅todo se usa com煤nmente para modelar y analizar datos con peque帽os tama帽os de muestra. A diferencia de los modelos param茅tricos, los modelos no param茅tricos no requieren que el modelador haga suposiciones sobre la distribuci贸n de la poblaci贸n, y a veces se los conoce como un m茅todo libre de distribuci贸n.

Agrupamiento o Clustering en el aprendizaje no supervisado

El agrupamiento puede considerarse el problema de aprendizaje no supervisado m谩s importante, entonces, como cualquier otro problema de este tipo, se trata de encontrar una estructura en una colecci贸n de datos sin etiqueta. Una definici贸n amplia de clustering podr铆a ser, el proceso de organizar objetos en grupos cuyos miembros son similares de alguna manera. Un cl煤ster es, por lo tanto, una colecci贸n de objetos que son similares entre ellos y son diferentes a los objetos que pertenecen a otros cl煤steres.

Curso Te贸rico-Pr谩ctico:Generaci麓贸n de Texto con Inteligencia Artificial

Algoritmos de aprendizaje no suspervisado 2

Los algoritmos de agrupaci贸n se pueden clasificar como se detalla a continuaci贸n:

Agrupamiento exclusivo: los datos se agrupan de manera exclusiva, de modo que si un cierto punto de datos pertenece a un grupo definido, entonces podr铆a no ser incluido en otro cl煤ster.

Superposici贸n de cl煤steres: usa conjuntos difusos para agrupar datos, de modo que cada punto puede pertenecer a dos o m谩s cl煤steres con diferentes grados de membres铆a. En este caso, los datos se asociar谩n con un valor de membres铆a apropiado.

Agrupamiento jer谩rquico: se basa en la uni贸n entre los dos cl煤steres m谩s cercanos. La condici贸n de inicio se realiza estableciendo cada punto de datos como un cl煤ster, despu茅s de algunas iteraciones alcanza los cl煤steres finales deseados.

Agrupaci贸n probabil铆stica: utiliza un enfoque probabil铆stico.

Algoritmos de aprendizaje no suspervisado 3

Los algoritmos de agrupamiento m谩s comunes incluyen:

Agrupaci贸n de cl煤steres k-Means: divide datos en cl煤steres distintos seg煤n la distancia al centroide de un cl煤ster.

Agrupamiento jer谩rquico: crea una jerarqu铆a multinivel de cl煤steres mediante la creaci贸n de un 谩rbol de cl煤steres.

Mezclas de modelos gaussianos: cl煤steres de modelos como una mezcla de componentes de densidad normal multivariante.

Importancia de aprendizaje no supervisado

Algoritmos de aprendizaje no suspervisado 4

El aprendizaje no supervisado pretende descubrir patrones previamente desconocidos en los datos, pero la mayor铆a de las veces estos patrones son aproximaciones pobres de lo que puede lograr el aprendizaje supervisado. Por ejemplo, los algoritmos no supervisados segmentar谩n a los clientes en grupos grandes en lugar de tratarlos como individuos y permitir que las empresas entreguen comunicaciones altamente personalizadas. La definici贸n del aprendizaje no supervisado es que no se sabe cu谩l ser谩 el resultado para un modelo predictivo, lo que significa que el aprendizaje supervisado es m谩s aplicable a contextos del mundo real.

El mejor momento para utilizar el aprendizaje no supervisado es cuando no tiene datos sobre los resultados deseados, como determinar un mercado objetivo para un producto completamente nuevo que tu empresa nunca haya vendido anteriormente, sin embargo, si solo est谩s tratando de obtener una mejor comprensi贸n de la base de consumidores existente, el aprendizaje supervisado es la t茅cnica 贸ptima.

Aplicaciones de los algoritmos de aprendizaje no supervisado

Los algoritmos de agrupamientos se pueden aplicar en muchos campos, por ejemplo:

Marketing: encontrar grupos de clientes con un comportamiento similar dada una gran base de datos de clientes que contienen sus propiedades y registros de compras anteriores.

Biolog铆a: clasificaci贸n de plantas y animales dadas sus caracter铆sticas.

Seguro: identificar fraudes.

Estudios de terremotos: aglomeraci贸n de epicentros de terremotos observados para identificar zonas peligrosas.

5 comentarios en “Todo sobre aprendizaje no supervisado en Machine Learning”

Deja un comentario

Tu direcci贸n de correo electr贸nico no ser谩 publicada.