用Python創建Dataframe

引言

在數據科學領域，經常需要對複雜且規模龐大的數據進行處理和分析。對於這些數據，最常用的方式就是將其組織成表格或矩陣的形式。在Python中，可以使用Pandas庫來創建和處理這些表格型數據。而這裡要介紹的是如何使用Python創建Dataframe。

正文

一、創建Dataframe對象

Dataframe是Pandas庫最重要的數據結構之一，是一種多維表格型數據結構。使用Pandas庫中的DataFrame類可以方便地創建一個Dataframe對象。

import pandas as pd

data = {'name': ['John', 'Sam', 'Anna'], 
        'age': [25, 32, 18], 
        'city': ['New York', 'Los Angeles', 'Chicago']}

df = pd.DataFrame(data)

print(df)

上述代碼創建了一個包含三列數據的Dataframe，其中每列數據的鍵名分別是name、age、city。可以看出，使用Pandas創建Dataframe十分簡單，只需要將數據存儲在一個Python的字典中即可。

二、讀取CSV文件生成Dataframe

除了手動創建Dataframe對象，還可以通過讀取CSV文件來生成Dataframe對象。CSV文件是一種以純文本形式存儲數據的文件格式，是一種非常常用的數據格式。

下面的例子展示了如何通過讀取CSV文件創建Dataframe對象：

import pandas as pd

data_path = "data.csv"
df = pd.read_csv(data_path)

print(df)

這段代碼讀取了當前目錄下名為”data.csv”的文件，並將其轉換成一個Dataframe。需要注意的是，數據文件需要提前準備好，並確保其格式正確，否則將無法成功轉換成Dataframe。

三、向Dataframe對象添加數據

在創建Dataframe的過程中，也可以逐步向Dataframe對象中添加數據。

import pandas as pd

df = pd.DataFrame(columns=["name", "age", "city"])

df.loc[0] = ["John", 25, "New York"]
df.loc[1] = ["Sam", 32, "Los Angeles"]
df.loc[2] = ["Anna", 18, "Chicago"]

print(df)

上述代碼通過創建一個空的Dataframe，並利用loc屬性，逐步向其中添加數據。

使用Pandas庫中的Dataframe類，可以方便地創建、讀取和修改Dataframe對象。在數據科學和機器學習中，Dataframe是數據預處理的重要步驟。熟練處理Dataframe將大大提高數據分析的效率和準確度。

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-hant/n/234066.html

用Python創建Dataframe

引言

正文

一、創建Dataframe對象

二、讀取CSV文件生成Dataframe

三、向Dataframe對象添加數據

相關推薦

發表回復