Machine Learning o Aprendizaje Automático

Explicación detallada de lo que se trata Machine Learning o Aprendizaje Automático, tanto su clasificación, algoritmos y los usos de la misma.

Conceptos básicos de Inteligencia Artificial

Conceptos básicos de Inteligencia Artificial

En el caso de que apenas te estas iniciando en tu camino en el aprendizaje de Inteligencia Artificial, es muy probable que tengas confusión con algunos conceptos que son fundamentales dentro de está área. Por lo que a continuación de explicaré brevemente los términos y conceptos clave que debes conocer y entender. Inteligencia Artificial La Inteligencia Artificial es un término que se refiere a la …

Conceptos básicos de Inteligencia Artificial Leer más »

Planificación de proyectos de Inteligencia Artificial

Planificación de proyectos de Inteligencia Artificial

En el mundo del desarrollo de software comercial, los inversores y gestores necesitan conocer el calendario y los resultados esperados antes de iniciar cualquier proyecto. Esta información les ayuda a determinar el presupuesto, el posible retorno de la inversión y, finalmente, si merece la pena gastar dinero en el proyecto. Hay multitud de técnicas para realizar estimaciones iniciales para empresas de ingeniería de software, y …

Planificación de proyectos de Inteligencia Artificial Leer más »

algoritmo apriori

Algoritmo Apriori – Teoría

Alguna vez te ha pasado que vas a comprar algo y acabas comprando mucho más de lo que tenías previsto. Este es un fenómeno conocido como compra impulsiva y los grandes comercios se aprovechan de Machine Learning y más específicamente del algoritmo Apriori para asegurarse que los clientes compremos más. Entender el algoritmo Apriori es fundamental para comprender muchas técnicas de análisis de la cesta …

Algoritmo Apriori – Teoría Leer más »

reglas de asociación aprendizaje no supervisado

Reglas de Asociación

Las reglas de asociación son declaraciones de “if-then”, que ayudan a mostrar la probabilidad de las relaciones entre los elementos de datos, dentro de grandes conjuntos de datos en diversos tipos de bases de datos. La minería de reglas de asociación tiene varias aplicaciones y se utiliza ampliamente para ayudar a descubrir correlaciones de ventas en datos de transacciones o en conjuntos de datos médicos. …

Reglas de Asociación Leer más »

inteligencia artificial vs machine learning vs deep learning

Inteligencia Artificial vs Machine Learning vs Deep Learning

Inteligencia Artificial y Machine Learning o Aprendizaje Automático, a menudo se usan indistintamente sin conocer exactamente a que se refiere, pero ahora se ha agregado un nuevo término que cada vez escuchamos más y más y es Deep Learning o Aprendizaje Profundo. Estos son palabras de moda que casi todos los días escuchamos, pero ¿cuál es el significado real de cada uno de ellos? ¿cuál …

Inteligencia Artificial vs Machine Learning vs Deep Learning Leer más »

DBSCAN practica con python

DBSCAN – Práctica

En este proyecto implementaremos el algoritmo de DBSCAN en Python, analizaremos un conjunto de datos que contiene información sobre los montos de gasto anual de varios clientes de diversas categorías de productos para la estructura interna. Nuestro objetivo es agrupar los datos para que podamos ver los productos que son comprados juntos por los clientes. Por ejemplo, si una persona va a la tienda a …

DBSCAN – Práctica Leer más »

machine learning definción en español

¿Qué es Machine Learning? – Definición en español

El hombre siempre ha estado enamorado y desconcertado por la inteligencia humana. La habilidad de aprender y entender patrones en cosas aparentemente no relacionadas ha contribuido mucho a nuestro éxito aquí en este planeta. Los investigadores siempre han estado a la caza del santo grial, la capacidad de replicar esta inteligencia en una máquina y, en el proceso, entender qué es lo que hace que …

¿Qué es Machine Learning? – Definición en español Leer más »

DBSCAN con scikit learn

DBSCAN – Scikit Learn

El análisis de agrupamiento es un problema importante en el análisis de datos y hoy en día, DBSCAN es una de las técnicas de análisis de clústeres más populares. Como lo explicamos anteriormente DBSCAN es un algoritmo de clúster o agrupamiento basado en la densidad que puede ser utilizado para identificar clústeres de cualquier forma en un conjunto de datos que contiene ruido y valores …

DBSCAN – Scikit Learn Leer más »

inteligencia artificial que es como funciona y para que se esta utilizando

¿Qué es y cómo funciona la Inteligencia Artificial?

Tabla de contenidos Seguramente cuando piensas en la Inteligencia Artificial, lo primero que se te viene a la mente son los robots, las máquinas con cerebro, e inclusive Matrix, Terminator o Ex Maquina. Esta es una apropiada, pero vaga comprensión de la Inteligencia Artificial. Por lo que, en esta publicación explicaremos la Inteligencia Artificial, qué es, cómo funciona y para que se está utilizando, a …

¿Qué es y cómo funciona la Inteligencia Artificial? Leer más »

DBSCAN aprendizaje no supervisado

DBSCAN Teoría

El análisis de agrupamiento es un problema importante en el análisis de datos. Y hoy en día DBSCAN es una de las técnicas de análisis de clústeres más populares. DBSCAN se refiere a la agrupación espacial de aplicaciones con ruido basada en la densidad, es el algoritmo de agrupación de datos propuesto a principios de los años 90 por un grupo de comunidad de base …

DBSCAN Teoría Leer más »

agrupamiento jerárquico practica con python

Algoritmo Agrupamiento Jerárquico – Práctica

En este proyecto implementaremos el algoritmo de Agrupamiento Jerárquico en Python, analizaremos un conjunto de datos que contiene información sobre los montos de gasto anual de varios clientes de diversas categorías de productos para la estructura interna. Nuestro objetivo es agrupar los datos para que podamos ver los productos que son comprados juntos por los clientes. Por ejemplo, si una persona va a la tienda …

Algoritmo Agrupamiento Jerárquico – Práctica Leer más »

agrupamiento jerarquico clustering python machine learning

Agrupamiento Jerárquico – Scikit Learn

https://youtu.be/ZnQdZfGs9-c La Agrupación Jerárquica es un tipo de algoritmo de Aprendizaje no Supervisado que se utiliza para agrupar puntos de datos no etiquetados. La Agrupación Jerárquica también agrupa los puntos de datos con características similares. En algunos casos, el resultado de la Agrupación Jerárquica y de K Means puede ser similar. Existen dos tipos de Agrupación Jerárquica: aglomerativa y divisoria. En el primero, los puntos …

Agrupamiento Jerárquico – Scikit Learn Leer más »

agrupamiento jerarquico clustering machine learning

Algoritmo Agrupamiento Jerárquico – Teoría

La técnica de Agrupación Jerárquica es una de las técnicas de agrupación más populares en Machine Learning. Como ya lo hemos explicado anteriormente, la agrupación es la extracción de agrupaciones naturales de objetos de datos similares. Hay un par de ideas generales que ocurren con bastante frecuencia con respecto a la agrupación: Los clústeres deben estar presentes de forma natural en los datos. El clustering …

Algoritmo Agrupamiento Jerárquico – Teoría Leer más »

libreria de python numpy machine learning

Librería NumPy

NumPy es, al igual que Pandas, Matplotlib o Scikit-Learn, uno de los paquetes que no puedes perderte cuando estás aprendiendo Machine Learning, principalmente porque esta librería proporciona una estructura de datos de matriz que tiene algunos beneficios sobre las listas regulares de Python. Algunos de estos beneficios son: ser más compacto, acceder más rápido a leer y escribir artículos, ser más conveniente y más eficiente. Definición NumPy es un módulo …

Librería NumPy Leer más »

algoritmos genéticos

Algoritmos Genéticos

Empecemos con la famosa cita de Charles Darwin: “No es la más fuerte de las especies la que sobrevive, ni la más inteligente, sino la que más se adapta al cambio”. Todo el concepto de los Algoritmos Genéticos se basa en esta cita. Los Algoritmos Genéticos son una técnica de optimización inspirada en la búsqueda basada en el principio de la selección natural de Darwin. …

Algoritmos Genéticos Leer más »

agrupamiento kmeans practica con python

Agrupamiento KMeans – Práctica con Python

En este proyecto implementaremos el algoritmo de Agrupamiento Kmeans en Python, analizaremos un conjunto de datos que contiene información sobre los montos de gasto anual de varios clientes de diversas categorías de productos para la estructura interna. Nuestro objetivo es agrupar los datos para que podamos ver los productos que son comprados juntos por los clientes. Por ejemplo, si una persona va a la tienda …

Agrupamiento KMeans – Práctica con Python Leer más »

algoritmo kmeans python clustering machine learning

Algoritmo KMeans – SKLearn

El clustering o agrupamiento es una técnica que nos permite encontrar grupos de objetos similares, objetos que están más relacionados entre sí que con objetos de otros grupos. Ejemplos de aplicaciones de clustering orientadas al negocio incluyen la agrupación de documentos, música y películas por diferentes temas, o la búsqueda de clientes que compartan intereses similares basados en comportamientos de compra comunes como base para …

Algoritmo KMeans – SKLearn Leer más »

pasos para construir un proyecto de machine learning

6 pasos para construir un proyecto de Machine Learning

Machine Learning es un tema importante en estos momentos y todo el mundo está tratando de conseguir cualquier forma que pueda obtener sobre el tema. Con la cantidad de información que existe, en ocasiones nos podemos sentir abrumado. Por lo tanto, acá te muestro los 6 pasos más importantes que debes considerar al momento de desarrollar un proyecto de Machine Learning. Hay muchas cosas a …

6 pasos para construir un proyecto de Machine Learning Leer más »

algoritmo kmeans clustering machine learning

Algoritmo KMeans – Teoría

La agrupación K Means es un tipo de Aprendizaje no Supervisado, que se utiliza cuando se tienen datos no etiquetados, es decir, datos sin categorías o grupos definidos. El objetivo de este algoritmo es encontrar grupos en los datos, con el número de grupos representados por la variable K. El algoritmo funciona de manera iterativa para asignar cada punto de datos a uno de los …

Algoritmo KMeans – Teoría Leer más »

implementar modelos de machine learning

Guía para implementar los modelos de Machine Learning

Los beneficios reales de la transformación de Machine Learning solo se puede conseguir cuando los modelos se utilizan constantemente en una retroalimentación de los datos de producción. Existen numerosas formas en las que las empresas pueden o necesitan implementar sus modelos de Machine Learning, lo que dicta son las limitaciones organizativas. API, la forma más común de implementar un modelo No se de extrañar que …

Guía para implementar los modelos de Machine Learning Leer más »

seleccionar número de clustering machine learning

Seleccionar el número adecuado de clústeres

La agrupación en clúster es una parte importante del proceso de Machine Learning para empresas comerciales o científicas que utilizan la Ciencia de Datos. Como su nombre lo indica, ayuda a identificar congregaciones de puntos de datos estrechamente relacionados, por alguna medida de distancia, en un conjunto de datos, los cuales, de otra manera, serían difíciles de entender. Sin embargo, en la mayoría de los …

Seleccionar el número adecuado de clústeres Leer más »

reducción de la dimensionalidad

Reducción de la Dimensionalidad

En los problemas de Machine Learning y de la ciencia de datos, el objetivo principal sigue siendo encontrar las características más relevantes que juegan un papel dominante en la determinación e influencia de los resultados de la producción. En la mayoría de los problemas de ciencia de datos, el conjunto de datos está sobrecargado con numerosas características que dan como resultado un ajuste excesivo y …

Reducción de la Dimensionalidad Leer más »

algoritmos de agrupamiento clustering machine learning

Algoritmos de Agrupamiento

Clustering es una técnica de Machine Learning que implica la agrupación de puntos de datos. Dado un conjunto de puntos de datos, podemos utilizar un algoritmo de agrupación para clasificar cada punto de datos en un clúster específico. En teoría, los puntos de datos que están en el mismo clúster deben tener propiedades y/o características similares, mientras que los puntos de datos en diferentes clústeres …

Algoritmos de Agrupamiento Leer más »

método de agrupamiento clustering

Método de Agrupamiento o Clustering

Antes de empezar a explicar de qué se trata el Clustering, veamos un ejemplo. Un banco quiere dar ofertas de tarjetas de crédito a sus clientes. En la actualidad, examinan los detalles de cada cliente y, basándose en esta información, deciden qué oferta se debe hacer a qué cliente. Ahora, el banco puede tener potencialmente millones de clientes, por lo que ¿tiene sentido mirar los …

Método de Agrupamiento o Clustering Leer más »

limpieza y procesamiento de datos con python

Limpieza y preprocesamiento de datos para principiantes con código en Python

La limpieza y preparación de datos es el primer paso más crítico en cualquier proyecto de Inteligencia Artificial y Machine Learning. Es normal que se dedique la mayor parte del tiempo, hasta un 70%, en la limpieza de los datos. En esta publicación te guiaré a través de estos pasos iniciales de limpieza y preprocesamiento de datos en Python, comenzando por la importación de las …

Limpieza y preprocesamiento de datos para principiantes con código en Python Leer más »

algoritmos de agrupamiento clustering machine learning

Aprendizaje no Supervisado

¿Qué se hace cuando el conjunto de datos no tiene etiquetas? Es en ese momento en que se debe usar el aprendizaje no supervisado, este es un grupo de algoritmos y enfoques de Machine Learning que funcionan con este tipo de datos de “verdad sin fundamento”. En la anterior serie de entradas, explicamos los algoritmos de Machine Learning de aprendizaje supervisado. Ahora nos centraremos en …

Aprendizaje no Supervisado Leer más »

curso machine learning español introducción a jupyter

Introducción a Jupyter Notebook

Python es un lenguaje de programación que permite comunicarte con tu computadora, pero para hacer esto necesitas la ayuda de un software o una aplicación específica. En el mercado existen muchas aplicaciones que cumplen con este propósito, una de ellas es Spyder de la cual he hablado en varios de mis videos, otra opción es la de utilizar la aplicación de Jupyter Notebook, la cual …

Introducción a Jupyter Notebook Leer más »

curso machine learning español pros y contras de los algoritmos de clasificación

Ventajas y Desventajas de los Algoritmos de Clasificación

Aunque un algoritmo no siempre será mejor que otro, hay algunas propiedades de cada algoritmo que podemos usar como guía para seleccionar el correcto de forma rápida y para ajustar los parámetros hiperactivos. Por lo tanto, la elección correcta del algoritmo a menudo permanece poco clara a menos que probemos nuestros algoritmos directamente a través de un simple ensayo y error. En esta entrada verás …

Ventajas y Desventajas de los Algoritmos de Clasificación Leer más »

por donde empezar a estudiar machine leanring

¿Por donde empezar a estudiar Machine Learning?

Esta es una pregunta recurrente que me hacen en los comentarios del video, así como directamente al correo. ¿Por donde empiezo a estudiar Machine Learning? E inclusive cualquier área de la Inteligencia Artificial. Mi respuesta siempre es la misma, todo depende de tus conocimientos previos y qué es lo que se te haga más fácil. Por ejemplo, si ya sabes algún lenguaje de programación se …

¿Por donde empezar a estudiar Machine Learning? Leer más »

curso machine learning español bosques aleatorios clasificación práctica con python

Bosques Aleatorios Clasificación – Práctica con Python

En esta entrada explicaremos la parte práctica del algoritmo de Bosques Aleatorio Clasificación, en donde desarrollaremos un modelo para predecir si un paciente tiene cáncer de seno o no. A su vez, te recomiendo que, si no haz visto la información anterior referente a la teoría y cómo implementar este algoritmo utilizando la librería Scikit Learn te vayas a verlos porque son las bases para …

Bosques Aleatorios Clasificación – Práctica con Python Leer más »

curso machine learning español bosques aleatorios clasificación scikit learn

Bosques Aleatorios Clasificación – Scikit Learn

Los Bosques Aleatorios es un algoritmo de aprendizaje supervisado. Como ya puedes ver en su nombre, crea un bosque y lo hace de alguna manera aleatoria. El bosque que construye, es un conjunto de árboles de decisión, la mayoría de las veces entrenados con el método de bagging. Si recuerdas la idea general del método de bagging es que una combinación de modelos de aprendizaje …

Bosques Aleatorios Clasificación – Scikit Learn Leer más »

curso machine learning español bosques aleatorios clasificación teoría

Bosques Aleatorios Clasificación – Teoría

Los Bosques Aleatorios es un algoritmo de aprendizaje supervisado. Puede utilizarse tanto para la clasificación como para la regresión. También es el algoritmo más flexible y fácil de usar. Un bosque está compuesto de árboles. Se dice que cuantos más árboles tenga, más robusto será el bosque. Los Bosques Aleatorios crea árboles de decisión a partir de muestras de datos seleccionados al azar, obtiene predicciones …

Bosques Aleatorios Clasificación – Teoría Leer más »

curso machine learning español árboles de decisión clasificación práctica con python

Árboles de Decisión Clasificación – Práctica con Python

En esta entrada vamos a explicar como poner en práctica el algoritmo de árboles de decisión clasificación. En este punto ya hemos explicado la teoría y cómo implementar este algoritmo utilizando la librería de Python scikit learn, por lo que ahora ha llegado el momento de poner en práctica este algoritmo. El proyecto que vamos a desarrollar es de cáncer de seno o BreastCancer, que …

Árboles de Decisión Clasificación – Práctica con Python Leer más »

curso machine learning español árboles de decisión clasificación scikit learn

Árboles de Decisión Clasificación – Scikit Learn

El algoritmo de árbol de decisión entra dentro de la categoría de aprendizaje supervisado. Utiliza la representación del árbol para resolver el problema en el que cada nodo de hoja corresponde a una etiqueta de clase y los atributos se representan en el nodo interno del árbol. Si quieres conocer más sobre este algoritmo puede acceder acá y contarás con información más detallada al respecto. …

Árboles de Decisión Clasificación – Scikit Learn Leer más »

curso machine learning español árboles de decisión clasificación teoría

Árboles de Decisión Clasificación – Teoría

Los árboles de decisión son uno de los algoritmos de Machine Learning más populares, esto se debe a que puede ser fácilmente visible para que un humano pueda entender lo que está sucediendo. Imagina un diagrama de flujo, donde cada nivel es una pregunta con una respuesta de si o no. Eventualmente una respuesta te dará una solución al problema inicial. Esto precisamente es un …

Árboles de Decisión Clasificación – Teoría Leer más »

Naive Bayes Práctica con Python machine learning

Naive Bayes – Práctica con Python

A continuación aprenderás cómo implementar el algoritmo Naive Bayes utilizando la librería de Python Scikit Learn, tomando en cuenta cada uno de los parámetros que debes considerar para ajustar y mejorar tus resultados.  Posteriormente desarrollaremos un proyecto de Machine Learning enfocándonos en el algoritmo Naive Bayes. Cada una de las explicaciones dadas acá será paso a paso para que puedas entender con detalle cada uno de los métodos …

Naive Bayes – Práctica con Python Leer más »

algoritmo Naive Bayes machine learning

Naive Bayes – Teoría

Naïve Bayes o el Ingenuo Bayes es uno de los algoritmos más simples y poderosos para la clasificación basado en el Teorema de Bayes con una suposición de independencia entre los predictores. Naive Bayes es fácil de construir y particularmente útil para conjuntos de datos muy grandes. Definición El clasificador Naive Bayes asume que el efecto de una característica particular en una clase es independiente de otras …

Naive Bayes – Teoría Leer más »

curso machine learning español máquinas vectores de soporte clasificación práctica con python

Máquinas de Vectores de Soporte Clasificación – Práctica

En esta entrada vamos a explicar como poner en práctica el algoritmo de Máquinas de Vectores de Soporte Clasificación. Con anterioridad ya explicamos la parte teórica e inclusive lo necesario para implementar este algoritmo utilizando la librería de Python, scikit learn, ahora ha llegado el momento de ver la parte práctica. Para esta entrada continuaremos desarrollando el proyecto que hemos venido trabajando a lo largo …

Máquinas de Vectores de Soporte Clasificación – Práctica Leer más »

curso machine learning español máquinas vectores de soporte clasificación scikit learn

Máquinas Vectores de Soporte Clasificación – Scikit Learn

En esta entrada hablaremos en cómo implementar el algoritmo de Maquinas Vectores de Soporte utilizando la librería de Python Scikit Learn. En una entrada anterior definimos que las Máquinas de Vectores de Soporte son un clasificador discriminatorio formalmente definido por un hiperplano de separación. En otras palabras, dada la etiqueta de datos de entrenamiento, el algoritmo produce un hiperplano óptimo que categoriza los nuevos ejemplos. …

Máquinas Vectores de Soporte Clasificación – Scikit Learn Leer más »

curso machine learning español máquinas vectores de soporte clasificación kernel

Kernel

En Machine Learning, los kernel o núcleos es un método para el análisis de patrones, cuyo miembro más conocido son las Maquinas de Vectores de Soporte. La tarea general del análisis de patrones es encontrar y estudiar tipos generales de relaciones en conjuntos de datos. Los kernel deben su nombre al uso de las funciones de núcleo, que les permiten operar en un espacio de …

Kernel Leer más »

curso machine learning español máquinas vectores de soporte clasificación teoría

Máquinas Vectores de Soporte Clasificación – Teoría

Las Máquinas Vectores de Soporte clasificación ofrece una precisión muy alta en comparación con otros clasificadores como la Regresión Logística y los Árboles de Decisión. Es conocido por su truco de kernel para manejar espacios de entrada no lineales. Se utiliza una variedad de aplicaciones tales como detección de rostros, detección de intrusos, clasificación de correos electrónicos, artículos de noticias y páginas web, entre otros. …

Máquinas Vectores de Soporte Clasificación – Teoría Leer más »

Qué es Git y GitHub

¿Qué es Git y GitHub?

GitHub es la plataforma que recomiendo para publicar los proyectos y crear el portafolio para presentar a los posibles empleadores. GitHub es una plataforma web para el control de versiones. Por su parte, Git simplifica el proceso de trabajo con otras personas y facilita la colaboración en proyectos. Git Git es un sistema de control de versiones, lo que eso significa realmente es que Git nos ayuda a …

¿Qué es Git y GitHub? Leer más »

K Vecinos más Cercanos programa con Python machine learning

K Vecinos más Cercanos – Práctica con Python

A continuación aprenderás cómo implementar el algoritmo de K Vecinos más Cercanos utilizando la librería de Python Scikit Learn, tomando en cuenta cada uno de los parámetros que debes considerar para ajustar y mejorar tus resultados.  Posteriormente desarrollaremos un proyecto de Machine Learning enfocándonos en el algoritmo de K Vecinos más Cercanos. Cada una de las explicaciones dadas acá será paso a paso para que puedas entender con …

K Vecinos más Cercanos – Práctica con Python Leer más »

algoritmo K Vecinos más Cercanos Teoría machine learning

K Vecinos más Cercanos – Teoría

K vecinos más cercanos es uno de los algoritmos de clasificación más básicos y esenciales en Machine Learning. Pertenece al dominio del aprendizaje supervisado y encuentra una aplicación intensa en el reconocimiento de patrones, la minería de datos y la detección de intrusos. Definición El algoritmo KNN es uno de los algoritmos de clasificación más simples, incluso con tal simplicidad puede dar resultados altamente competitivos. Pertenece al dominio de …

K Vecinos más Cercanos – Teoría Leer más »

libros de machine learning

Libros para aprender Machine Learning

Una pregunta recurrente desde que inicie el canal es que les recomiende libros para continuar su aprendizaje sobre este tema. En la actualidad hay un montón de recursos gratuitos disponibles en línea, como las que yo ofrezco. Cada una de estas opciones, son excelentes, pero estoy consciente que a veces es mejor hacer las cosas a la antigua. Hay pocos recursos que puedan igualar el …

Libros para aprender Machine Learning Leer más »

algoritmo regresión logística machine learning practica con python

Regresión Logística – Práctica con Python

A continuación aprenderás a desarrollar un proyecto de Machine Learning enfocándonos en el algoritmo Regresión Logística. Cada una de las explicaciones dadas acá será paso a paso para que puedas entender con detalle cada uno de los métodos explicados acá y que los puedas implementar en tus propios proyectos. Empecemos con la explicación del proyecto. Definición del proyecto En esta práctica del algoritmo de Regresión Logística, se …

Regresión Logística – Práctica con Python Leer más »

algoritmo regresión logística machine learning teoría

Regresión Logística – Teoría

Las técnicas de clasificación son una parte esencial de Machine Learning, ya que aproximadamente el 70% de los problemas son de clasificación. Hay muchos algoritmos de clasificación, pero la Regresión Logística es común y es un método de regresión útil para resolver problemas de clasificación binaria. Definición La regresión logística o Logistic Regression es un algoritmo de clasificación que se utiliza para predecir la probabilidad de una variable dependiente categórica. …

Regresión Logística – Teoría Leer más »

curso machine learning español conjunto de datos desbalanceado

Conjunto de datos desbalanceado

¿Qué tienen en común los conjuntos de datos para la detección de fraudes en la banca, o las ofertas en el tiempo real en mercadeo o la detección de intrusos en redes? Fácil, que los datos utilizados en estas áreas a menudo tienen menos del 1% de los eventos raros pero interesantes, por ejemplo, los estafadores que usan tarjetas de créditos, el usuario que hace …

Conjunto de datos desbalanceado Leer más »

curso machine learning español métricas de evaluación modelos clasificación

Métricas de Evaluación Clasificación con Scikit Learn

En una anterior entrada te expliqué toda la parte teoría para calcular los errores al momento de construir un modelo utilizando algoritmos de clasificación. Bueno, acá te explicaré como puedes implementar cada uno de esas métricas utilizando la librería de Scikit Learn. A medida que entrenas tu modelo predictivo de clasificación, seguramente querrás evaluar qué tan bueno es. Curiosamente, hay muchas maneras diferentes de evaluar …

Métricas de Evaluación Clasificación con Scikit Learn Leer más »

curso machine learning español curva roc y auc

Curvas ROC y Área bajo la curva (AUC)

En Machine Learning, la medición del rendimiento es una tarea esencial. Entonces, cuando se trata de un problema de clasificación, podemos contar con una curva AUC-ROC. Esta es una de las métricas de evaluación más importante para verificar el rendimiento de cualquier modelo de clasificación. ROC viene de las características de funcionamiento del receptor y AUC del área bajo la curva. Para entender mejor lo …

Curvas ROC y Área bajo la curva (AUC) Leer más »

curso machine learning español errores en los modelos de clasificación

Evaluando el error en los modelos de clasificación

Después de realizar la evaluación de las características de los datos, la selección del algoritmo y la implementación de un modelo y obtener algunos resultados, el siguiente paso es averiguar qué tan efectivo es el modelo basado en alguna métrica. Se utilizan diferentes métricas de rendimiento para evaluar los modelos de clasificación, la elección de la misma influye en cómo se mide y compara el …

Evaluando el error en los modelos de clasificación Leer más »

curso machine learning español matriz de confsión

Matriz de Confusión

Un modelo de clasificación de Machine Learning es aquel que predice una variable “y” que es categórica como, por ejemplo, si un empleado dejará la organización o se quedará, si un paciente tiene cáncer o no o si un cliente pagará o incumplirá un préstamo. La Matriz de Confusión es una de las métricas más intuitivas y sencillas que se utiliza para encontrar la precisión …

Matriz de Confusión Leer más »

curso machine learning español pros y contras de los algoritmos de regresión

Ventajas y Desventajas de los Algoritmos de Regresión

Al abordar cualquier tipo de problema de Machine Learning hay muchos algoritmos para elegir, pero hay algo que debemos tener claro y es que ningún algoritmo es el mejor para todos los problemas, cada uno de ellos cuentan con sus algunos pros y sus contras, lo cual no sirve como guía para seleccionar el más adecuado. Aunque recuerda que el rendimiento de los diferentes algoritmos …

Ventajas y Desventajas de los Algoritmos de Regresión Leer más »

bosques aleatorios regresión practica con python machine learning

Bosques Aleatorios Regresión – Práctica con Python

A continuación aprenderás cómo implementar el algoritmo de Bosques Aleatorios Regresión utilizando la librería de Python Scikit Learn, tomando en cuenta cada uno de los parámetros que debes considerar para ajustar y mejorar tus resultados.  Posteriormente desarrollaremos un proyecto de Machine Learning enfocándonos en el algoritmo de Bosques Aleatorios Regresión . Cada una de las explicaciones dadas acá será paso a paso para que puedas entender con detalle cada …

Bosques Aleatorios Regresión – Práctica con Python Leer más »

bosques aleatorios regresión teoría machine learning

Bosque Aleatorios Regresión – Teoría

Los Bosques Aleatorios es un algoritmo de Machine Learning flexible y fácil de usar que produce, incluso sin ajuste de parámetros, un gran resultado la mayor parte del tiempo. También es uno de los algoritmos más utilizados, debido a su simplicidad y al hecho de que se puede usar tanto para tareas de clasificación como de regresión. Definición Los Bosques Aleatorios es un algoritmo de aprendizaje …

Bosque Aleatorios Regresión – Teoría Leer más »

curso machine learning español ensamble de modelos

Métodos de Ensamble de Modelos

Los métodos de ensamble de modelos o métodos combinados intentan ayudar a mejorar el rendimiento de los modelos de Machine Learning al mejorar su precisión. Este es un proceso mediante el cual se construyen estratégicamente varios modelos de Machine Learning para resolver un problema particular. Pero veamos esto con un ejemplo: Supongamos que quieres invertir en una empresa, pero no estas seguro de su rendimiento …

Métodos de Ensamble de Modelos Leer más »

árboles de decisión regresión practica con python machine learning

Árboles de Decisión Regresión – Práctica con Python

A continuación aprenderás cómo implementar el algoritmo de Árboles de Decisión Regresión utilizando la librería de Python Scikit Learn, tomando en cuenta cada uno de los parámetros que debes considerar para ajustar y mejorar tus resultados.  Posteriormente desarrollaremos un proyecto de Machine Learning enfocándonos en el algoritmo de Árboles de Decisión Regresión Cada una de las explicaciones dadas acá será paso a paso para que puedas entender con …

Árboles de Decisión Regresión – Práctica con Python Leer más »

arboles de decisión regresión teoría machine learning

Árboles de Decisión Regresión – Teoría

Un árbol tiene muchas analogías en la vida real, y resulta que ha influido en una amplia área del aprendizaje automático o Machine Learning. Los árboles de decisión son una técnica de aprendizaje supervisado que predice valores de respuestas mediante el aprendizaje de reglas de decisión derivadas de características. Se pueden utilizar tanto en una regresión como en un contexto de clasificación.Expliquemos un poco la teoría detrás de …

Árboles de Decisión Regresión – Teoría Leer más »

maquina de vectores de soporte regresión práctica con python

Vectores de Soporte Regresión – Práctica con Python

A continuación aprenderás cómo implementar el algoritmo de Vectores de Soporte Regresión utilizando la librería de Python Scikit Learn, tomando en cuenta cada uno de los parámetros que debes considerar para ajustar y mejorar tus resultados.  Posteriormente desarrollaremos un proyecto de Machine Learning enfocándonos en el algoritmo de Vectores de Soporte Regresión. Cada una de las explicaciones dadas acá será paso a paso para que puedas entender …

Vectores de Soporte Regresión – Práctica con Python Leer más »

algoritmo maquina de vectores de soporte regresión machine learning

Vectores de Soporte Regresión – Teoría

El algoritmo  de Vectores de Soporte Regresión se basa en buscar la curva o hiperplano que modele la tendencia de los datos de entrenamiento y según ella predecir cualquier dato en el futuro. No te preocupes, ya vas a entender mejor este concepto. Este algoritmo se puede utilizar tanto para problemas de regresión como de clasificación, para esta publicación nos enfocaremos a explicar el algoritmo de regresión. Definición …

Vectores de Soporte Regresión – Teoría Leer más »