Crear o inicializar un DataFrame de Pandas
En el módulo de Python Pandas, DataFrame es un tipo muy básico e importante. Para crear un DataFrame a partir de diferentes fuentes de datos u otros tipos de datos de Python, podemos utilizar el constructor DataFrame()
.
En este tutorial, aprenderemos diferentes formas de crear e inicializar Pandas DataFrame.
Sintaxis de la clase DataFrame()
La sintaxis de la clase DataFrame()
es
DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)
Donde todos los argumentos son opcionales
data
puede ser ndarray, iterable, diccionario u otro dataframe.index
puede ser un índice o un array. Si no se proporciona ningún índice, se utiliza por defecto el índice de rango, es decir, de 0 a número de filas – 1.columns
se utiliza para etiquetar las columnasdtype
se utiliza para especificar o forzar un tipo de dato en los datos. Si no se especifica,dtype
se infiere de los propios datos.copy
si esTrue
, copia los datos de las entradas. Tenga en cuenta que esto sólo afecta a las entradas DataFrame o 2d ndarray.
Ejemplo 1: Crear un DataFrame vacío
Para crear un DataFrame vacío, no hay que pasar ningún argumento a la clase pandas.DataFrame()
.
En este ejemplo, creamos un DataFrame vacío y lo imprimimos en la salida de la consola.
import pandas as pd
df = pd.DataFrame()
print(df)
Salida:
Empty DataFrame
Columns: []
Index: []
Como no hemos proporcionado ningún argumento, el array de columns
está vacío y el array de index
también.
Ejemplo 2: Crear un DataFrame a partir de una lista de listas
Para inicializar un DataFrame a partir de una lista de listas, se puede pasar esta lista de listas al constructor pandas.DataFrame()
como argumento de data
.
En este ejemplo, crearemos un DataFrame para una lista de listas.
import pandas as pd
#lista de listas
data = [['a1', 'b1', 'c1'],
['a2', 'b2', 'c2'],
['a3', 'b3', 'c3']]
df = pd.DataFrame(data)
print(df)
Salida:
0 1 2
0 a b c
1 d e f
2 g h i
3 j k l
Ejemplo 3: Crear un DataFrame a partir de un diccionario
Para inicializar un DataFrame a partir de un diccionario, pase este diccionario al constructor pandas.DataFrame()
como argumento de datos.
En este ejemplo, crearemos un DataFrame para un diccionario.
DataFrame a partir de un diccionario con orientación en columnas
import pandas as pd
datos = {'columna_1': [3, 2, 1, 0], 'columna_2': ['a', 'b', 'c', 'd']}
gn = pd.DataFrame.from_dict(datos)
print(gn)
Salida:
columna_1 columna_2
0 3 a
1 2 b
2 1 c
3 0 d
DataFrame a partir de un diccionario con orientación en filas
import pandas as pd
datos = {'fila_1': [3, 2, 1, 0], 'fila_2': ['a', 'b', 'c', 'd']}
gn = pd.DataFrame.from_dict(datos, orient="index")
print(gn)
Salida:
0 1 2 3
fila_1 3 2 1 0
fila_2 a b c d
En este tutorial de Pandas, aprendimos a crear un DataFrame vacío, y luego a crear un DataFrame con datos de diferentes objetos de Python, con la ayuda de ejemplos bien detallados.