Pandas是一個用於數據操作和分析的Python庫,它提供了豐富的數據處理工具,包括DataFrame,它是一種二維表格數據結構。在使用DataFrame時,經常需要對列名進行修改,以更好地反映數據的含義。本文將從多個方面對Pandas修改列名做詳細的闡述。
一、使用rename方法
在Pandas中,最基本的修改列名的方法是使用rename()方法。可以使用字典將原始列名映射為新的列名。
import pandas as pd # 創建數據 data = {'name': ['Michael', 'John', 'Tom'], 'age': [18, 21, 20], 'gender': ['Male', 'Male', 'Female']} df = pd.DataFrame(data) # 使用rename()方法修改列名 df.rename(columns={'name': '姓名', 'age': '年齡', 'gender': '性別'}, inplace=True)
上述代碼將原來的列名”name”、”age”和”gender”分別修改為”姓名”、”年齡”和”性別”。
二、使用set_axis方法
另一種修改列名的方法是使用set_axis()方法。該方法可以更改DataFrame或系列的行名稱或列名稱。
import pandas as pd # 創建數據 data = {'name': ['Michael', 'John', 'Tom'], 'age': [18, 21, 20], 'gender': ['Male', 'Male', 'Female']} df = pd.DataFrame(data) # 使用set_axis()方法修改列名 new_columns = ['姓名', '年齡', '性別'] df.set_axis(new_columns, axis='columns', inplace=True)
set_axis()方法的第一個參數是新的列名列表,axis參數指定為”columns”表示修改列名。
三、使用.columns屬性
Pandas還提供了一個.columns屬性,它包含了DataFrame的列名。
import pandas as pd # 創建數據 data = {'name': ['Michael', 'John', 'Tom'], 'age': [18, 21, 20], 'gender': ['Male', 'Male', 'Female']} df = pd.DataFrame(data) # 使用.columns屬性修改列名 df.columns = ['姓名', '年齡', '性別']
.columns屬性直接修改列名列表即可。
四、使用rename_axis方法
在Pandas 0.21版本之後,DataFrame和Series對象具備了兩個軸的名稱(axis name):行名稱(row label)和列名稱(column label)。默認情況下,行名稱和列名稱使用None進行初始設置。因此,在Pandas中,可以使用rename_axis()方法來設置行名稱和列名稱。
import pandas as pd # 創建數據 data = {'name': ['Michael', 'John', 'Tom'], 'age': [18, 21, 20], 'gender': ['Male', 'Male', 'Female']} df = pd.DataFrame(data) # 使用rename_axis()方法設置列名稱 df = df.rename_axis(index=None, columns='個人信息')
上述代碼中,將”姓名”、”年齡”和”性別”三個列名整體修改為”個人信息”,並用rename_axis()方法設置列名稱。
五、在創建DataFrame時設定列名
在創建Pandas DataFrame時,可以同時指定列名。
import pandas as pd # 指定列名創建DataFrame data = {'姓名': ['Michael', 'John', 'Tom'], '年齡': [18, 21, 20], '性別': ['Male', 'Male', 'Female']} df = pd.DataFrame(data)
直接在字典中指定列名即可。
六、使用Categorical數據類型
在一些情況下,可以使用Categorical數據類型來修改列名。
import pandas as pd # 創建數據 data = {'name': ['Michael', 'John', 'Tom'], 'age': [18, 21, 20], 'gender': ['Male', 'Male', 'Female']} df = pd.DataFrame(data) # 使用Categorical數據類型修改列名 df.columns = pd.CategoricalIndex(['姓名', '年齡', '性別'])
Categorical數據類型使得修改列名變得更加直觀和易於理解。
結束語
本文從多個方面對Pandas修改列名做了詳細的闡述。在實際開發中,由於數據本身的特點和需求的多樣性,可能會出現更加複雜和多變的修改列名的方式,但我們可以根據不同的情況,選擇最合適的方法進行使用。
原創文章,作者:YNBDL,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/362674.html