Preprocesamiento de Datos

agrupando los datos con python

Agrupando los datos con Python

El agrupamiento de datos o binning en ingles, es un m茅todo de preprocesamiento de datos y consiste en agrupar valores en compartimientos. En ocasiones este agrupamiento puede mejorar la precisi贸n de los modelos predictivos y, a su vez, puede mejorar la comprensi贸n de la distribuci贸n de los datos. El m茅todo nos lo proporciona panda y se llama 鈥減d. cut鈥. Veamos un ejemplo utilizando los datos …

Agrupando los datos con Python Leer m谩s 禄

cambiando variables catego虂ricas por nume虂ricas con python

Cambiando variables categor铆as por variables num茅ricas con Python

Los algoritmos matem谩ticos no pueden incluir objetos o cadenas como entrada ni para el entrenamiento del modelo, ac谩 solo toma n煤meros, pero justamente es, en estos casos, que se puede hacer una peque帽a modificaci贸n en la data para cambiar los datos categ贸ricos en num茅ricos. Veamos esto utilizando los datos que hemos venido trabajando del Titanic, si vemos la columna de 鈥淪exo鈥, tenemos que los datos …

Cambiando variables categor铆as por variables num茅ricas con Python Leer m谩s 禄

manipulando los datos con python

Manipulando datos perdidos en Python

En la gran mayor铆a de datos con la que trabajemos es muy probable que nos encontremos con valores perdidos, esto es algo muy normal. El valor faltante puede aparecer de distintas formas por ejemplo como un signo de interrogaci贸n, o N/A, como un 0 o simplemente como una celda en blanco, pero en su mayor铆a nos lo encontramos representado como NaN que se refiere a …

Manipulando datos perdidos en Python Leer m谩s 禄

explorando los datos con python

Explorando los datos con Python

Ya hemos importado los datos para el an谩lisis, ahora lo que debemos hacer es entender esa data para planear c贸mo debemos continuar, para ello Python y m谩s espec铆ficamente Pandas cuenta con varios m茅todos integrados que pueden usarse para comprender el tipo de datos o para ver la distribuci贸n de datos dentro del conjunto de dados. El uso de estos m茅todos proporciona una visi贸n general del …

Explorando los datos con Python Leer m谩s 禄

importar y exportar datos con python

Importando y Exportando datos en Python

El primer paso que debemos realizar al momento de cualquier an谩lisis que hagamos es, obviamente, tener los datos con los que vamos a trabajar, por lo que necesitamos importarlos, para ello vamos a utilizar la librer铆a de Pandas de Python. Para realizar este proceso debemos tomar en cuenta el formato y la ubicaci贸n del archivo. El formato se refiere a la forma en que codifican …

Importando y Exportando datos en Python Leer m谩s 禄

preprocesamiento de datos en machine learning

Introducci贸n al Preprocesamiento de Datos con Python

Encontramos datos en todas partes, estos pueden ser recolectados de manera manual por cient铆ficos, pero ahora es cada vez m谩s com煤n que sean recolectados de manera digital utilizando aplicaciones especificas configuradas para este prop贸sito. Pero tenemos que tener claro que los datos no necesariamente signifiquen informaci贸n, por lo que es necesario aplicar un an谩lisis a los mismos para que nos ayude a responder preguntas, descubrir …

Introducci贸n al Preprocesamiento de Datos con Python Leer m谩s 禄