Preprocesamiento de Datos

agrupando los datos con python

Agrupando los datos con Python

El agrupamiento de datos o binning en ingles, es un método de preprocesamiento de datos y consiste en agrupar valores en compartimientos. En ocasiones este agrupamiento puede mejorar la precisión de los modelos predictivos y, a su vez, puede mejorar la comprensión de la distribución de los datos. El método nos lo proporciona panda y se llama “pd. cut”. Veamos un ejemplo utilizando los datos …

Agrupando los datos con Python Leer más »

cambiando variables categóricas por numéricas con python

Cambiando variables categorías por variables numéricas con Python

Los algoritmos matemáticos no pueden incluir objetos o cadenas como entrada ni para el entrenamiento del modelo, acá solo toma números, pero justamente es, en estos casos, que se puede hacer una pequeña modificación en la data para cambiar los datos categóricos en numéricos. Veamos esto utilizando los datos que hemos venido trabajando del Titanic, si vemos la columna de “Sexo”, tenemos que los datos …

Cambiando variables categorías por variables numéricas con Python Leer más »

explorando los datos con python

Explorando los datos con Python

Ya hemos importado los datos para el análisis, ahora lo que debemos hacer es entender esa data para planear cómo debemos continuar, para ello Python y más específicamente Pandas cuenta con varios métodos integrados que pueden usarse para comprender el tipo de datos o para ver la distribución de datos dentro del conjunto de dados. El uso de estos métodos proporciona una visión general del …

Explorando los datos con Python Leer más »

importar y exportar datos con python

Importando y Exportando datos en Python

El primer paso que debemos realizar al momento de cualquier análisis que hagamos es, obviamente, tener los datos con los que vamos a trabajar, por lo que necesitamos importarlos, para ello vamos a utilizar la librería de Pandas de Python. Para realizar este proceso debemos tomar en cuenta el formato y la ubicación del archivo. El formato se refiere a la forma en que codifican …

Importando y Exportando datos en Python Leer más »

preprocesamiento de datos en machine learning

Introducción al Preprocesamiento de Datos con Python

Encontramos datos en todas partes, estos pueden ser recolectados de manera manual por científicos, pero ahora es cada vez más común que sean recolectados de manera digital utilizando aplicaciones especificas configuradas para este propósito. Pero tenemos que tener claro que los datos no necesariamente signifiquen información, por lo que es necesario aplicar un análisis a los mismos para que nos ayude a responder preguntas, descubrir …

Introducción al Preprocesamiento de Datos con Python Leer más »