-
Pandas y la info del dataframe
Existirá momentos en los que se requiera conocer mas información de un dataframe que permita decir cuántas columnas de tipo entero, fecha, decimal existe en él. Para ello se hace uso de la función info que trae pandas; la sintaxis para su uso es la que se muestra a continuación: ¿Cómo se usa? Bien, mantener el siguiente supuesto: “el csv pruebas” se requiere saber los tipos de columnas que tiene. En la imagen 1 se puede apreciar que aparece en la terminal el número de indice, se observa una columna con el nombre column donde se indica los nombre de cada una de las columnas que tiene el df (dataframe)…
-
Pandas y las primeras – últimos registros
Cuando inicias a trabajar con pandas y empiezas a analizar los datos de los csv que se cargan se llega a requerir que se tenga que visualizar los primeros 10 o cinco registros, en su defecto los últimos 10 o cinco registros. Esto brinda una noción de los tipos de datos que puede contener un dataframe. La sintaxis que suele usarse para mostrar los primeros registros es la siguiente: La sintaxis para mostrar las últimas filas es la que se muestra a continuación: Usando head y tails Teniendo un dataframe donde solo se quieren visualizar los primeros cinco registros y los últimas cinco filas. Observe que en la imagen 1,…
-
Pandas y los renombres
Bueno puede llegar a pasar que cuando se este leyendo un csv en pandas se quiera realizar algún renombre de alguna columna, y es posible hacerlo con la función rename. El uso más básico se muestra a continuación: No es necesario nombrar a todas las columnas solo a las que se le desea cambiar el nombre, es decir, si se tiene 10 columnas y solo se desea cambiar dos, solo se indica el nombre de la columna, seguido de dos puntos y el nombre nuevo para esa columna. La palabra inplace=True permite que esos cambios se vean reflejado en el dataframe en cuestión. Suponer que se tiene un dataframe con…
-
Leyendo archivos con pandas en python
De la librería de pandas, se puede comentar que entre tantas cosas facilita muchas cosas entre ellas la lectura de archivos, es super fácil y puede abrir desde archivos csv hasta xls. No hay que olvidar la importación de la librería de pandas. La sintaxis es la siguientes: Bajo el supuesto de que se quiera leer un archivo con el nombre “pruebas.csv” usando pandas se haría de la siguiente forma: Con esas dos líneas se tendría el contenido del csv en la variable df. Si al momento de crear el archivo csv se le coloco el separador de la coma (,) o el puto y coma (;), quedaría algo como:…
-
Python, los pandas y sus profiling
En el apartado de los análisis de datos, para su comprensión y entrega de reportes que permiten mapear un mejor entendimiento de los mismos, se topa uno con pandas_profiling ¿Qué es eso? Se debe de recordar que pandas es el nombre de una de las librerías usadas en python que permiten y facilitan la extracción de los datos. Profiling viene ha ser la forma en que se pueden mostrar todos esos resultados. (vea imagen 1). ¿Cómo se uso? Muy sencillo, bueno desde luego primero hay que instalar la librería y ya después hacer uso de ella. Para instalar panda_profiling has uso del siguiente comando: pip3 install pandas_profiling[notebook,html]. Después hay que…
-
Shimoku | Prueba de concepto
En la actualidad la forma en que se presentan los datos y con la rapidez que se requiere hace necesario la creación de librerías shimoku, permite hacer este salto. Es decir, con el dataframe (los datos) se pueden expresar en gráfica de todo tipo, de barras, pastel, histogramas y demás. Preparación del ambiente Para poder agilizar las cosas, es de cierta manera necesario hacer uso de panda una librería escrita para la extracción y análisis de datos. O al menos para esta prueba de concepto se utilizo, también hay que instalar la librería shimoku, desde una terminal ejecutando los siguientes comandos: Nota: es importante que la versión de python sea…