一、dataframe.columns[0]
在pandas的DataFrame中,columns是一個Series,用來表示每列的名稱。columns[0]表示第0列的列名。如果我們需要用到某個DataFrame的第0列,可以直接使用dataframe[dataframe.columns[0]]。
import pandas as pd df = pd.DataFrame({'A':[1,2,3], 'B':[4,5,6], 'C':[7,8,9]}) print(df[df.columns[0]])
輸出結果如下:
0 1 1 2 2 3 Name: A, dtype: int64
二、dataframe.columns轉list
dataframe.columns是一個Series,用來表示每列的名稱,我們可以直接將其轉成一個list。一般情況下我們會用到columns來選取某列或者多列,然後進行其他的操作,比如數據處理以及可視化。因此將columns轉成list非常方便。
import pandas as pd df = pd.DataFrame({'A':[1,2,3], 'B':[4,5,6], 'C':[7,8,9]}) print(list(df.columns))
輸出結果如下:
['A', 'B', 'C']
三、dataframe.columns
dataframe.columns是一個Series,通常用來表示DataFrame的每列的名稱。在操作DataFrame的時候,我們可以通過想dataframe.columns傳入一列的名稱來選取這一列。當columns中存在中文或特殊字元時,可能會出現亂碼的情況。這時候可以對columns進行編碼轉換:
import pandas as pd df = pd.DataFrame({'姓名':['張三','李四','王五'], '年齡':[20,30,40], '分數':[90,80,70]}) df.columns = [col.encode('utf8') for col in df.columns] print(df)
輸出結果如下:
ç’å…· ñÔÅ¥ ϣȮ 0 ó»¾Ç 20 90 1 ëœ±Ï 30 80 2 ĈÐÈ¥ 40 70
四、dataframe.columns亂碼
當DataFrame中有中文或特殊字元時,columns可能會出現亂碼。這時候我們需要進行編碼轉換。具體方式是使用str.decode將utf8編碼轉成unicode編碼。
import pandas as pd df = pd.DataFrame({'姓名':['張三','李四','王五'], '年齡':[20,30,40], '分數':[90,80,70]}) df.columns = [col.encode('utf8') for col in df.columns] df.columns = [col.decode('utf8') for col in df.columns] print(df)
輸出結果如下:
姓名 年齡 分數 0 張三 20 90 1 李四 30 80 2 王五 40 70
五、dataframe.columns之rename()
我們也可以使用rename方法來對columns進行修改,方法有幾種,這裡介紹一種簡單易懂的方法。rename()的參數columns是一個字典,使用這個字典來映射現有columns的名稱以及新的名稱。
import pandas as pd df = pd.DataFrame({'A':[1,2,3], 'B':[4,5,6], 'C':[7,8,9]}) df.rename(columns={'A':'a', 'B':'b', 'C':'c'}, inplace=True) print(df)
輸出結果如下:
a b c 0 1 4 7 1 2 5 8 2 3 6 9
六、dataframe.columns之astype()
有的時候,我們需要將某一列的數據類型進行轉換。這時候,可以使用astype(),比如將某一列的數據類型從int轉成float,將某一列的數據類型從object轉成datetime。
import pandas as pd df = pd.DataFrame({'A':[1,2,3], 'B':[4,5,6], 'C':['2020-01-01','2020-01-02','2020-01-03']}) df['A'] = df['A'].astype(float) df['C'] = pd.to_datetime(df['C'], format='%Y-%m-%d') print(df.dtypes)
輸出結果如下:
A float64 B int64 C datetime64[ns] dtype: object
七、dataframe.columns之unique()
unique()方法可以幫我們找到某個columns所有不同的值。這個方法經常用在數據分析中需要對某個列進行分類匯總的情況下。比如,需要統計某個含有分類標籤的列中有哪些不同的分類。就可以使用unique()方法。
import pandas as pd df = pd.DataFrame({'地區':['北京','上海','廣州','北京','深圳','上海']}) print(df['地區'].unique())
輸出結果如下:
['北京' '上海' '廣州' '深圳']
八、dataframe.columns之value_counts()
value_counts()方法可以幫助我們統計某個列中每個值出現的次數,通常用來對某一列的數據進行分組及統計分析。
import pandas as pd df = pd.DataFrame({'地區':['北京','上海','廣州','北京','深圳','上海']}) print(df['地區'].value_counts())
輸出結果如下:
上海 2 北京 2 廣州 1 深圳 1 Name: 地區, dtype: int64
九、dataframe.columns之nunique()
nunique()方法可以返回某個columns中有多少個不同的值。可以通過len(df[column].unique())來驗證結果。
import pandas as pd df = pd.DataFrame({'地區':['北京','上海','廣州','北京','深圳','上海']}) print(df['地區'].nunique())
輸出結果如下:
4
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/183835.html