全面解析dataframe.columns

一、dataframe.columns[0]

在pandas的DataFrame中，columns是一個Series，用來表示每列的名稱。columns[0]表示第0列的列名。如果我們需要用到某個DataFrame的第0列，可以直接使用dataframe[dataframe.columns[0]]。

import pandas as pd
df = pd.DataFrame({'A':[1,2,3], 'B':[4,5,6], 'C':[7,8,9]})
print(df[df.columns[0]])

輸出結果如下：

0    1
1    2
2    3
Name: A, dtype: int64

二、dataframe.columns轉list

dataframe.columns是一個Series，用來表示每列的名稱，我們可以直接將其轉成一個list。一般情況下我們會用到columns來選取某列或者多列，然後進行其他的操作，比如數據處理以及可視化。因此將columns轉成list非常方便。

import pandas as pd
df = pd.DataFrame({'A':[1,2,3], 'B':[4,5,6], 'C':[7,8,9]})
print(list(df.columns))

輸出結果如下：

['A', 'B', 'C']

三、dataframe.columns

dataframe.columns是一個Series，通常用來表示DataFrame的每列的名稱。在操作DataFrame的時候，我們可以通過想dataframe.columns傳入一列的名稱來選取這一列。當columns中存在中文或特殊字元時，可能會出現亂碼的情況。這時候可以對columns進行編碼轉換：

import pandas as pd
df = pd.DataFrame({'姓名':['張三','李四','王五'], '年齡':[20,30,40], '分數':[90,80,70]})
df.columns = [col.encode('utf8') for col in df.columns]
print(df)

輸出結果如下：

    ç’å…·  ñÔÅ¥  Ï£È®
0  ó»¾Ç  20   90
1  ëœ±Ï  30   80
2  ĈÐÈ¥  40   70

四、dataframe.columns亂碼

當DataFrame中有中文或特殊字元時，columns可能會出現亂碼。這時候我們需要進行編碼轉換。具體方式是使用str.decode將utf8編碼轉成unicode編碼。

import pandas as pd
df = pd.DataFrame({'姓名':['張三','李四','王五'], '年齡':[20,30,40], '分數':[90,80,70]})
df.columns = [col.encode('utf8') for col in df.columns]
df.columns = [col.decode('utf8') for col in df.columns]
print(df)

輸出結果如下：

  姓名  年齡  分數
0  張三  20  90
1  李四  30  80
2  王五  40  70

五、dataframe.columns之rename()

我們也可以使用rename方法來對columns進行修改，方法有幾種，這裡介紹一種簡單易懂的方法。rename()的參數columns是一個字典，使用這個字典來映射現有columns的名稱以及新的名稱。

import pandas as pd
df = pd.DataFrame({'A':[1,2,3], 'B':[4,5,6], 'C':[7,8,9]})
df.rename(columns={'A':'a', 'B':'b', 'C':'c'}, inplace=True)
print(df)

輸出結果如下：

六、dataframe.columns之astype()

有的時候，我們需要將某一列的數據類型進行轉換。這時候，可以使用astype()，比如將某一列的數據類型從int轉成float，將某一列的數據類型從object轉成datetime。

import pandas as pd
df = pd.DataFrame({'A':[1,2,3], 'B':[4,5,6], 'C':['2020-01-01','2020-01-02','2020-01-03']})
df['A'] = df['A'].astype(float)
df['C'] = pd.to_datetime(df['C'], format='%Y-%m-%d')
print(df.dtypes)

輸出結果如下：

A           float64
B             int64
C    datetime64[ns]
dtype: object

七、dataframe.columns之unique()

unique()方法可以幫我們找到某個columns所有不同的值。這個方法經常用在數據分析中需要對某個列進行分類匯總的情況下。比如，需要統計某個含有分類標籤的列中有哪些不同的分類。就可以使用unique()方法。

import pandas as pd
df = pd.DataFrame({'地區':['北京','上海','廣州','北京','深圳','上海']})
print(df['地區'].unique())

輸出結果如下：

['北京' '上海' '廣州' '深圳']

八、dataframe.columns之value_counts()

value_counts()方法可以幫助我們統計某個列中每個值出現的次數，通常用來對某一列的數據進行分組及統計分析。

import pandas as pd
df = pd.DataFrame({'地區':['北京','上海','廣州','北京','深圳','上海']})
print(df['地區'].value_counts())

輸出結果如下：

上海    2
北京    2
廣州    1
深圳    1
Name: 地區, dtype: int64

九、dataframe.columns之nunique()

nunique()方法可以返回某個columns中有多少個不同的值。可以通過len(df[column].unique())來驗證結果。

import pandas as pd
df = pd.DataFrame({'地區':['北京','上海','廣州','北京','深圳','上海']})
print(df['地區'].nunique())

輸出結果如下：

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-tw/n/183835.html

全面解析dataframe.columns

一、dataframe.columns[0]

二、dataframe.columns轉list

三、dataframe.columns

四、dataframe.columns亂碼

五、dataframe.columns之rename()

六、dataframe.columns之astype()

七、dataframe.columns之unique()

八、dataframe.columns之value_counts()

九、dataframe.columns之nunique()

相關推薦

發表回復