詳解pandas改列名

pandas是Python語言中的一個數據分析庫，主要用於數據清洗、數據整合、數據建模等操作。在使用pandas處理數據時，有許多列名不符合數據分析的標準，因此就需要對列名進行改名操作。本文將從多個方面詳細闡述如何使用pandas改列名。

一、基本方法

使用pandas改列名的基本方法是通過rename()函數進行操作。rename()函數通過字典的方式傳入原列名和新列名的對應關係，從而實現對列名的改名。下面是一個簡單的示例：

import pandas as pd

# 創建一個DataFrame
data = {'name': ['Tom', 'John', 'Bill'], 'age': [25, 30, 28]}
df = pd.DataFrame(data)

# 改名操作
df = df.rename(columns={'name': 'new_name', 'age': 'new_age'})

# 輸出結果
print(df.head())

上面的代碼中，我們先創建了一個包含兩列數據的DataFrame，然後通過rename()函數將原來的列名name和age改成了new_name和new_age。結果如下：

   new_name  new_age
0       Tom       25
1      John       30
2      Bill       28

二、選擇性更改

在實際的業務場景中，我們可能只需要對其中的幾列進行改名，這時可以使用rename()函數的columns參數。該參數是一個字典，鍵名為原列名，鍵值為新列名，只會對指定的列進行更改。下面是一個示例：

import pandas as pd

# 創建一個DataFrame
data = {'name': ['Tom', 'John', 'Bill'], 'age': [25, 30, 28], 'gender': ['M', 'M', 'F']}
df = pd.DataFrame(data)

# 改名操作，只更改name和age兩列
df = df.rename(columns={'name': 'new_name', 'age': 'new_age'}, index={0: 'a', 1: 'b', 2: 'c'}, columns=['name', 'age'])

# 輸出結果
print(df.head())

上面的代碼中，我們指定只對name和age兩列進行改名，而gender列沒有更改。同時，我們還加了index參數，用於指定行索引的更改。columns參數用於指定哪些列需要更改，這裡我們只指定了name和age。結果如下：

   new_name  new_age gender
a       Tom       25      M
b      John       30      M
c      Bill       28      F

三、使用str函數更改列名

在實際的業務場景中，我們可能需要對列名進行批量更改，這裡我們可以使用pandas的str函數實現。我們可以通過str.replace()函數來實現更改，通過正則表達式來匹配我們需要更改的部分。下面是一個示例：

import pandas as pd

# 創建一個DataFrame
data = {'name': ['Tom', 'John', 'Bill'], 'age': [25, 30, 28], 'gender(M/F)': ['M', 'M', 'F']}
df = pd.DataFrame(data)

# 批量更改列名
df.columns = df.columns.str.replace('\(.*\)', '')

# 輸出結果
print(df.head())

上面的代碼中，我們創建了一個包含三列數據的DataFrame，其中gender(M/F)列名包含了(M/F)字符，我們需要將其去除。這裡使用str.replace()函數，通過正則表達式匹配(M/F)字符，並將其刪除。結果如下：

   name  age gender
0   Tom   25      M
1  John   30      M
2  Bill   28      F

四、使用set_axis()函數更改列名

在pandas的版本0.21及以上，我們可以使用set_axis()函數來更改DataFrame的列名。該函數使用的是關鍵字參數，可以一次性將所有列名進行更改。下面是一個示例：

import pandas as pd

# 創建一個DataFrame
data = {'name': ['Tom', 'John', 'Bill'], 'age': [25, 30, 28], 'gender': ['M', 'M', 'F']}
df = pd.DataFrame(data)

# 批量更改列名
df = df.set_axis(['new_name', 'new_age', 'new_gender'], axis=1, inplace=False)

# 輸出結果
print(df.head())

上面的代碼中，我們使用set_axis()函數將所有的列名進行更改。需要注意的是，該函數會返回一個新的DataFrame，原來的DataFrame並沒有更改。該函數的第一個參數為列名列表，第二個參數為軸的編號，第三個參數為是否原地更改。結果如下：

  new_name  new_age new_gender
0      Tom       25          M
1     John       30          M
2     Bill       28          F

五、結合apply()函數更改列名

在實際的業務場景中，我們可能需要進行複雜的更改操作，這時我們可以結合apply()函數來實現。apply()函數可以將自定義函數應用於每一行或列，實現對數據的自定義處理。下面是一個示例：

import pandas as pd

# 創建一個DataFrame
data = {'name': ['Tom', 'John', 'Bill'], 'age': [25, 30, 28], 'gender': ['M', 'M', 'F']}
df = pd.DataFrame(data)

# 定義更改函數
def change_name(name):
    if name == 'John':
        return 'J'
    else:
        return name

# 更改操作
df.columns = df.columns.map(change_name)

# 輸出結果
print(df.head())

上面的代碼中，我們定義了一個更改函數change_name()，該函數返回原列名或者對原列名進行更改。這裡我們將原來的列名中的John改成了J。然後使用map()函數對所有列名進行更改。結果如下：

   Tom  J    Bill
0  Tom  25      M
1  J    30      M
2  Bill 28      F

總結

本文從基本方法、選擇性更改、使用str函數更改列名、使用set_axis()函數更改列名、結合apply()函數更改列名等多個方面詳細闡述了如何使用pandas改列名。在實際的數據處理中，更改列名是一個非常常見的操作，熟練掌握改名操作對於提高數據處理效率和質量都有很大幫助。

原創文章，作者：DJSRV，如若轉載，請註明出處：https://www.506064.com/zh-hant/n/324541.html