articulo

Pandas y los renombres

Bueno puede llegar a pasar que cuando se este leyendo un csv en pandas se quiera realizar algún renombre de alguna columna, y es posible hacerlo con la función rename. El uso más básico se muestra a continuación:

df.rename(columns={'nombre_columna': 'nuevo_nombre_columna', 'nombre_columna2': 'nuevo_nombre_columna2'}, 
                 inplace=True)

No es necesario nombrar a todas las columnas solo a las que se le desea cambiar el nombre, es decir, si se tiene 10 columnas y solo se desea cambiar dos, solo se indica el nombre de la columna, seguido de dos puntos y el nombre nuevo para esa columna. La palabra inplace=True permite que esos cambios se vean reflejado en el dataframe en cuestión.

Suponer que se tiene un dataframe con tres campos en donde tiene por nombre hora, instalados y registrados y se quiere cambiar solo el nombre de registrado a register. Para ello hay que hacer lo siguiente:

  1. Leer el csv. Mira aquí para hacerlo.
  2. Ejecutar la sintaxis presentada al inicio, quedaría algo así

df.rename(columns= {'registrados': 'register'}, inplace=True
Imagen 1. Cambiar nombre de columna de un dataframe en pandas. Fuente: tumblr.com

En la imagen uno se pueden observar unas tres cosas:

  1. Las lineas de código que se usan para leer un csv y hacer el cambio de nombre de columna.
  2. La forma en que se recibe el dataframe con el nombre del campo ‘registrados’ (cuadro superior)
  3. La forma en que se realiza la afectación al nombre de la columna del datagrama (cuadro inferior). Ya con el nombre «register»

Notas:

  1. Hay que colocar el nombre de la columna que se quiere afectar exactamente cómo se encuentra. Es decir, puede que tenga un espacio en blanco y al ejecutar la función rename de pandas no se vea ningún efecto. O se tenga una letra de más que no se haya visto.

El código fuente de este ejercicio lo encuentras en el git

Dejar una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *