以Python新建DataFrame為中心

引言

在數據分析和數據處理過程中，最主要的操作之一就是數據表格的處理。而在Python語言中，pandas這個強大的庫提供了DataFrame數據結構，給我們帶來了很大的便利。

本文將會以Python新建DataFrame為中心，從多個方面對其進行詳細的闡述。希望能夠為讀者在數據分析和數據處理過程中提供幫助。

正文

一、DataFrame是什麼

DataFrame是一種二維的、表格形式的數據結構，類似於SQL中的表格或者Excel中的電子表格。它由pandas庫提供，並且功能非常強大。

在DataFrame中，每列可以是不同的數據類型，比如整型、浮點型、字元串等。同時，我們還可以為每一列設置列名，並且可以對表中的數據進行訪問和操作。

二、新建DataFrame

1、從csv文件中讀取數據

代碼示例：

import pandas as pd

df = pd.read_csv('data.csv')

在上面的代碼中，我們通過pandas庫中的read_csv函數，將data.csv文件中的數據讀取到DataFrame中，並將結果賦值給變數df。

2、從字典中讀取數據

代碼示例：

import pandas as pd

data = {'Name': ['Tom', 'Jack', 'Steve', 'Ricky'],
        'Age': [28, 34, 29, 42],
        'Salary': [30000, 24000, 27000, 40000]}
df = pd.DataFrame(data)

print(df)

在上面的代碼中，我們首先定義了一個字典data，它包含了三個鍵值對，分別表示姓名、年齡和薪水。接著，我們通過pandas庫中的DataFrame函數，將字典data轉換為DataFrame結構，並將結果賦值給變數df。最後，我們通過print函數將變數df輸出。

三、DataFrame的基本操作

1、選擇數據

我們可以通過loc和iloc兩個屬性來選擇DataFrame中的數據。

在使用loc屬性時，我們需要指定索引名稱和列名，下面是一個例子：

代碼示例：

import pandas as pd

data = {'Name': ['Tom', 'Jack', 'Steve', 'Ricky'],
        'Age': [28, 34, 29, 42],
        'Salary': [30000, 24000, 27000, 40000]}
df = pd.DataFrame(data)

print(df.loc[0, 'Name'])

print(df.loc[0:2, 'Name':'Age'])

在上面的代碼中，我們首先按照上面的方式定義了一個DataFrame。然後，我們通過df.loc[0, ‘Name’]的方式選擇了第一行第一列的數據，輸出了Tom。接著，我們通過df.loc[0:2, ‘Name’:’Age’]的方式選擇了第一行到第三行，第一列到第二列的數據，並將結果輸出。

在使用iloc屬性時，我們需要指定索引和列號，下面是一個例子：

代碼示例：

import pandas as pd

data = {'Name': ['Tom', 'Jack', 'Steve', 'Ricky'],
        'Age': [28, 34, 29, 42],
        'Salary': [30000, 24000, 27000, 40000]}
df = pd.DataFrame(data)

print(df.iloc[0, 0])

print(df.iloc[0:2, 0:2])

在上面的代碼中，我們首先按照上面的方式定義了一個DataFrame。然後，我們通過df.iloc[0, 0]的方式選擇了第一行第一列的數據，輸出了Tom。接著，我們通過df.iloc[0:2, 0:2]的方式選擇了第一行到第二行，第一列到第二列的數據，並將結果輸出。

2、修改數據

我們可以通過直接賦值的方式，來修改DataFrame中的數據。下面是一個例子：

代碼示例：

import pandas as pd

data = {'Name': ['Tom', 'Jack', 'Steve', 'Ricky'],
        'Age': [28, 34, 29, 42],
        'Salary': [30000, 24000, 27000, 40000]}
df = pd.DataFrame(data)

df.loc[0, 'Name'] = 'Jerry'

print(df)

在上面的代碼中，我們首先按照上面的方式定義了一個DataFrame。然後，我們通過df.loc[0, ‘Name’]的方式選擇了第一行第一列的數據，並將其修改為了Jerry。最後，我們通過print函數將變數df輸出，查看數據是否被正確修改。

3、刪除數據

我們可以通過drop函數來刪除DataFrame中的數據。下面是一個例子：

代碼示例：

import pandas as pd

data = {'Name': ['Tom', 'Jack', 'Steve', 'Ricky'],
        'Age': [28, 34, 29, 42],
        'Salary': [30000, 24000, 27000, 40000]}
df = pd.DataFrame(data)

df = df.drop(0)

print(df)

在上面的代碼中，我們首先按照上面的方式定義了一個DataFrame。然後，我們通過df.drop(0)的方式刪除了第一行數據。最後，我們通過print函數將變數df輸出，查看數據是否被正確刪除。

小結

本文主要針對Python新建DataFrame進行詳細的闡述，並從多個方面對其進行了介紹。理解了DataFrame這個數據結構，我們可以更加輕鬆地進行數據分析和數據處理。

原創文章，作者：CLXP，如若轉載，請註明出處：https://www.506064.com/zh-tw/n/143526.html

以Python新建DataFrame為中心

引言

正文

一、DataFrame是什麼

二、新建DataFrame

1、從csv文件中讀取數據

代碼示例：

2、從字典中讀取數據

代碼示例：

三、DataFrame的基本操作

1、選擇數據

代碼示例：

代碼示例：

2、修改數據

代碼示例：

3、刪除數據

代碼示例：

小結

相關推薦

發表回復