Añadir una columna al DataFrame de Pandas
Para añadir una nueva columna al DataFrame de Pandas existente, asigne los valores de la nueva columna al DataFrame, indexado con el nombre de la nueva columna.
En este tutorial, aprenderemos cómo añadir una columna al DataFrame, con la ayuda de programas de ejemplo, que van a ser muy detallados e ilustrativos.
Sintaxis para añadir columna
La sintaxis para añadir una columna al DataFrame es:
miDataFrame['nombre_columna_nueva'] = valores_columna
Donde miDataFrame
es el dataFrame al que desea añadir la nueva columna con la etiqueta nombre_columna_nueva
. Puede proporcionar todos los valores de la columna como una lista o un solo valor que se toma como valor por defecto para todas las filas.
Ejemplo 1: Añadir una columna a un DataFrame de Pandas
En este ejemplo, crearemos un dataframe df
y añadiremos una nueva columna con nombre geometría
.
import pandas as pd
miDiccionario = {'nombres': ['Somu', 'Kiku', 'Amol', 'Lini'],
'física': [68, 74, 77, 78],
'química': [84, 56, 73, 69],
'álgebra': [78, 88, 82, 87]}
#crear marco de datos
df = pd.DataFrame(miDiccionario)
print('Original DataFrame\n--------------')
print(df)
#añadir columna
df['geometría'] = [81, 92, 67, 76]
print('DataFrame después de añadir la columna "geometría" --------------')
print(df)
Saludo:
Original DataFrame
--------------
nombres física química álgebra
0 Somu 68 84 78
1 Kiku 74 56 88
2 Amol 77 73 82
3 Lini 78 69 87
DataFrame después de añadir la columna "geometría" --------------
nombres física química álgebra geometría
0 Somu 68 84 78 81
1 Kiku 74 56 88 92
2 Amol 77 73 82 67
3 Lini 78 69 87 76
La columna se añade al DataFrame con la lista especificada como valores de la columna.
La longitud de la lista que proporcione para la nueva columna debe ser igual al número de filas del DataFrame. Si esta condición falla, obtendrá un error similar al siguiente.
ValueError: Length of values (3) does not match length of index (4)
Ejemplo 2: Añadir una columna al DataFrame de Pandas con un valor por defecto
En este ejemplo, crearemos un dataframe df
y añadiremos una nueva columna llamada geometría
con un valor por defecto para cada una de las filas del dataframe.
import pandas as pd
miDiccionario = {'nombres': ['Somu', 'Kiku', 'Amol', 'Lini'],
'física': [68, 74, 77, 78],
'química': [84, 56, 73, 69],
'álgebra': [78, 88, 82, 87]}
#crear marco de datos
df = pd.DataFrame(miDiccionario)
print('Original DataFrame\n--------------')
print(df)
#añadir columna
df['geometría'] = 77
print('DataFrame después de añadir la columna "geometría" --------------')
print(df)
Salida:
Original DataFrame
--------------
nombres física química álgebra
0 Somu 68 84 78
1 Kiku 74 56 88
2 Amol 77 73 82
3 Lini 78 69 87
DataFrame después de añadir la columna "geometría" --------------
nombres física química álgebra geometría
0 Somu 68 84 78 77
1 Kiku 74 56 88 77
2 Amol 77 73 82 77
3 Lini 78 69 87 77
La columna se añade al DataFrame con el valor especificado como valor de columna por defecto.
En este tutorial de Pandas, hemos aprendido a añadir una nueva columna al DataFrame de Pandas con la ayuda de ejemplos detallados de Python.