引言
在數據分析和數據處理過程中,最主要的操作之一就是數據表格的處理。而在Python語言中,pandas這個強大的庫提供了DataFrame數據結構,給我們帶來了很大的便利。
本文將會以Python新建DataFrame為中心,從多個方面對其進行詳細的闡述。希望能夠為讀者在數據分析和數據處理過程中提供幫助。
正文
一、DataFrame是什麼
DataFrame是一種二維的、表格形式的數據結構,類似於SQL中的表格或者Excel中的電子表格。它由pandas庫提供,並且功能非常強大。
在DataFrame中,每列可以是不同的數據類型,比如整型、浮點型、字元串等。同時,我們還可以為每一列設置列名,並且可以對表中的數據進行訪問和操作。
二、新建DataFrame
1、從csv文件中讀取數據
代碼示例:
import pandas as pd
df = pd.read_csv('data.csv')
在上面的代碼中,我們通過pandas庫中的read_csv函數,將data.csv文件中的數據讀取到DataFrame中,並將結果賦值給變數df。
2、從字典中讀取數據
代碼示例:
import pandas as pd
data = {'Name': ['Tom', 'Jack', 'Steve', 'Ricky'],
'Age': [28, 34, 29, 42],
'Salary': [30000, 24000, 27000, 40000]}
df = pd.DataFrame(data)
print(df)
在上面的代碼中,我們首先定義了一個字典data,它包含了三個鍵值對,分別表示姓名、年齡和薪水。接著,我們通過pandas庫中的DataFrame函數,將字典data轉換為DataFrame結構,並將結果賦值給變數df。最後,我們通過print函數將變數df輸出。
三、DataFrame的基本操作
1、選擇數據
我們可以通過loc和iloc兩個屬性來選擇DataFrame中的數據。
在使用loc屬性時,我們需要指定索引名稱和列名,下面是一個例子:
代碼示例:
import pandas as pd
data = {'Name': ['Tom', 'Jack', 'Steve', 'Ricky'],
'Age': [28, 34, 29, 42],
'Salary': [30000, 24000, 27000, 40000]}
df = pd.DataFrame(data)
print(df.loc[0, 'Name'])
print(df.loc[0:2, 'Name':'Age'])
在上面的代碼中,我們首先按照上面的方式定義了一個DataFrame。然後,我們通過df.loc[0, ‘Name’]的方式選擇了第一行第一列的數據,輸出了Tom。接著,我們通過df.loc[0:2, ‘Name’:’Age’]的方式選擇了第一行到第三行,第一列到第二列的數據,並將結果輸出。
在使用iloc屬性時,我們需要指定索引和列號,下面是一個例子:
代碼示例:
import pandas as pd
data = {'Name': ['Tom', 'Jack', 'Steve', 'Ricky'],
'Age': [28, 34, 29, 42],
'Salary': [30000, 24000, 27000, 40000]}
df = pd.DataFrame(data)
print(df.iloc[0, 0])
print(df.iloc[0:2, 0:2])
在上面的代碼中,我們首先按照上面的方式定義了一個DataFrame。然後,我們通過df.iloc[0, 0]的方式選擇了第一行第一列的數據,輸出了Tom。接著,我們通過df.iloc[0:2, 0:2]的方式選擇了第一行到第二行,第一列到第二列的數據,並將結果輸出。
2、修改數據
我們可以通過直接賦值的方式,來修改DataFrame中的數據。下面是一個例子:
代碼示例:
import pandas as pd
data = {'Name': ['Tom', 'Jack', 'Steve', 'Ricky'],
'Age': [28, 34, 29, 42],
'Salary': [30000, 24000, 27000, 40000]}
df = pd.DataFrame(data)
df.loc[0, 'Name'] = 'Jerry'
print(df)
在上面的代碼中,我們首先按照上面的方式定義了一個DataFrame。然後,我們通過df.loc[0, ‘Name’]的方式選擇了第一行第一列的數據,並將其修改為了Jerry。最後,我們通過print函數將變數df輸出,查看數據是否被正確修改。
3、刪除數據
我們可以通過drop函數來刪除DataFrame中的數據。下面是一個例子:
代碼示例:
import pandas as pd
data = {'Name': ['Tom', 'Jack', 'Steve', 'Ricky'],
'Age': [28, 34, 29, 42],
'Salary': [30000, 24000, 27000, 40000]}
df = pd.DataFrame(data)
df = df.drop(0)
print(df)
在上面的代碼中,我們首先按照上面的方式定義了一個DataFrame。然後,我們通過df.drop(0)的方式刪除了第一行數據。最後,我們通過print函數將變數df輸出,查看數據是否被正確刪除。
小結
本文主要針對Python新建DataFrame進行詳細的闡述,並從多個方面對其進行了介紹。理解了DataFrame這個數據結構,我們可以更加輕鬆地進行數據分析和數據處理。
原創文章,作者:CLXP,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/143526.html