Crear o inicializar un DataFrame de Pandas

En el módulo de Python Pandas, DataFrame es un tipo muy básico e importante. Para crear un DataFrame a partir de diferentes fuentes de datos u otros tipos de datos de Python, podemos utilizar el constructor DataFrame().

En este tutorial, aprenderemos diferentes formas de crear e inicializar Pandas DataFrame.

Sintaxis de la clase DataFrame()

La sintaxis de la clase DataFrame() es

DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)

Donde todos los argumentos son opcionales

  • data puede ser ndarray, iterable, diccionario u otro dataframe.
  • index puede ser un índice o un array. Si no se proporciona ningún índice, se utiliza por defecto el índice de rango, es decir, de 0 a número de filas – 1.
  • columns se utiliza para etiquetar las columnas
  • dtype se utiliza para especificar o forzar un tipo de dato en los datos. Si no se especifica, dtype se infiere de los propios datos.
  • copy si es True, copia los datos de las entradas. Tenga en cuenta que esto sólo afecta a las entradas DataFrame o 2d ndarray.

Ejemplo 1: Crear un DataFrame vacío

Para crear un DataFrame vacío, no hay que pasar ningún argumento a la clase pandas.DataFrame().

En este ejemplo, creamos un DataFrame vacío y lo imprimimos en la salida de la consola.

import pandas as pd

df = pd.DataFrame()

print(df)

Salida:

Empty DataFrame
Columns: []    
Index: []

Como no hemos proporcionado ningún argumento, el array de columns está vacío y el array de index también.

Ejemplo 2: Crear un DataFrame a partir de una lista de listas

Para inicializar un DataFrame a partir de una lista de listas, se puede pasar esta lista de listas al constructor pandas.DataFrame() como argumento de data.

En este ejemplo, crearemos un DataFrame para una lista de listas.

import pandas as pd

#lista de listas
data = [['a1', 'b1', 'c1'],
        ['a2', 'b2', 'c2'],
        ['a3', 'b3', 'c3']]

df = pd.DataFrame(data)
print(df)

Salida:

   0  1  2
0  a  b  c
1  d  e  f
2  g  h  i
3  j  k  l

Ejemplo 3: Crear un DataFrame a partir de un diccionario

Para inicializar un DataFrame a partir de un diccionario, pase este diccionario al constructor pandas.DataFrame() como argumento de datos.

En este ejemplo, crearemos un DataFrame para un diccionario.

DataFrame a partir de un diccionario con orientación en columnas

import pandas as pd

datos = {'columna_1': [3, 2, 1, 0], 'columna_2': ['a', 'b', 'c', 'd']}

gn = pd.DataFrame.from_dict(datos)

print(gn)

Salida:

   columna_1 columna_2
0          3         a
1          2         b
2          1         c
3          0         d

DataFrame a partir de un diccionario con orientación en filas

import pandas as pd

datos = {'fila_1': [3, 2, 1, 0], 'fila_2': ['a', 'b', 'c', 'd']}

gn = pd.DataFrame.from_dict(datos, orient="index")

print(gn)

Salida:

        0  1  2  3
fila_1  3  2  1  0
fila_2  a  b  c  d

En este tutorial de Pandas, aprendimos a crear un DataFrame vacío, y luego a crear un DataFrame con datos de diferentes objetos de Python, con la ayuda de ejemplos bien detallados.

Deja una respuesta