Python pandas教程：如何使用set_index重置數據索引

Pandas是一個Python庫，它提供了用於數據操作和分析的數據結構和函數。在許多數據分析任務中，我們需要使用Pandas來讀取、清理和處理數據，以便後續使用。其中，set_index()是一個非常有用的函數，它被用來重新設置DataFrame的索引。

一、set_index()函數的定義

set_index()是一個DataFrame的函數，用於將現有的一列或多列設置為DataFrame的索引。在沒有指定參數的情況下，它會將現有的行索引替換為新的索引。

import pandas as pd
df = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
                   'B': ['B0', 'B1', 'B2', 'B3'],
                   'C': ['C0', 'C1', 'C2', 'C3'],
                   'D': ['D0', 'D1', 'D2', 'D3']})
print(df)
df = df.set_index('A') #將A列設置為索引
print(df)

上面代碼中，我們創建了一個DataFrame並列印了它。然後，我們使用set_index()函數將『A』列設置為索引，並再次列印。結果如下：

output:
    A   B  C   D
0  A0  B0  C0  D0
1  A1  B1  C1  D1
2  A2  B2  C2  D2
3  A3  B3  C3  D3

     B  C   D
A           
A0  B0  C0  D0
A1  B1  C1  D1
A2  B2  C2  D2
A3  B3  C3  D3

可以看出，set_index()函數將『A』列設置為索引後，原有的行索引被替換了。

二、設置多個索引

set_index()函數還可以設置多個索引。對於一個普通的DataFrame，你可以向set_index()函數傳遞一個列表，該列表包含要設置為索引的列名。下面是一個示例：

import pandas as pd
df = pd.DataFrame({'A': [0, 1, 2, 3],
                   'B': ['X', 'Y', 'X', 'Y'],
                   'C': ['I', 'II', 'III', 'IV']})
print(df)
df = df.set_index(['B', 'C']) #將B和C列設置為索引
print(df)

在上面的代碼示例中，我們創建了一個DataFrame，然後使用set_index()函數將『B』和『C』兩列設置為索引。結果如下：

output:
   A  B    C
0  0  X   I
1  1  Y  II
2  2  X III
3  3  Y  IV

        A
B C      
X I     0
Y II    1
X III   2
Y IV    3

我們可以看出，set_index()函數將『B』和『C』列設置為索引後，DataFrame的行索引發生了變化。

三、重置索引

除了設置新的索引，set_index()函數還可以用於重置現有的DataFrame的索引。可以使用reset_index()函數將現有的索引重置為默認的整數索引，並將原有的索引列作為DataFrame的一部分。下面是示例代碼：

import pandas as pd
df = pd.read_csv('data.csv')
df = df.set_index('ID')  # 將ID列設置為索引
df = df.reset_index()  # 重置索引
print(df)

在上面的代碼示例中，我們讀取了一個名為『data.csv』的CSV文件，並使用set_index()函數將『ID』列設置為索引，然後使用reset_index()函數重置索引，並列印DataFrame。結果如下：

output:
     ID  Name  Age
0  1001   Tom   18
1  1002   Amy   20
2  1003  Jack   21
3  1004   Bob   22
4  1005  Lucy   19

我們可以看出，reset_index()函數將『ID』列恢復為DataFrame的一部分，並將原有的行索引（0-4）作為新的索引。

四、總結

在數據分析任務中，set_index()是一個非常有用的函數，它可以用於重新設置DataFrame的索引。它可以將現有的一列或多列設置為索引，也可以用於重置現有DataFrame的索引。在實際應用中，我們可以根據具體情況使用set_index()函數，以便更好地處理和分析數據。

原創文章，作者：YRZZH，如若轉載，請註明出處：https://www.506064.com/zh-tw/n/330133.html

Python pandas教程：如何使用set_index重置數據索引

一、set_index()函數的定義

二、設置多個索引

三、重置索引

四、總結

相關推薦

發表回復