Pandas行列轉置

一、概述

Pandas是一個基於NumPy的數據處理庫，提供一種高效的DataFrame結構用於數據分析。在數據分析中，經常會遇到需要對數據進行轉置的情況。行列轉置是指將DataFrame的行變為列，列變為行，以達到更佳的分析需求。Pandas提供了行列轉置的操作，本文將從多個方面為大家詳細闡述如何進行Pandas行列轉置。

二、基本使用

進行Pandas行列轉置非常簡單，只需要在DataFrame後面加上” .T “即可實現。例如：

import pandas as pd

df = pd.read_csv('data.csv')
df_T = df.T  # 將數據框df進行轉置
print(df_T)

代碼中，通過pd.read_csv()讀取了一個csv文件並將數據存入一個名為df的DataFrame中，然後通過添加”.T”操作將df進行轉置，並將結果存儲在一個名為df_T的新DataFrame中。最後打印出轉置後的結果。

三、轉置之後的列名和索引

進行行列轉換後，列名和索引也會相應地改變。例如我們有一個如下的數據框：

    name  age  sex
0  Alice   25    F
1    Bob   30    M
2  Cindy   28    F

轉置後得到的數據框為：

        0    1      2
name  Alice  Bob  Cindy
age      25   30     28
sex       F    M      F

可以看到，轉置後數據框的列名為原來數據框的索引，而其行索引則為原來數據框的列名。

四、轉置的實現方式

在Pandas中，行列轉置可以通過不同的方法實現。

1.使用T屬性

使用DataFrame的T屬性可以直接將DataFrame進行轉置。例如：

df_T = df.T

2.使用transpose()方法

transpose()方法也可以用於DataFrame的轉置操作，它與T屬性的作用是相同的。例如：

df_T = df.transpose()

3.使用numpy庫中的transpose()方法

numpy庫中也提供了transpose()方法，可以用於數據框的轉置操作。例如：

import numpy as np

df_T = pd.DataFrame(np.transpose(df.values), index=df.columns, columns=df.index)

代碼中，將DataFrame的values屬性進行轉置，並將結果傳遞給pd.DataFrame()函數，再根據原DataFrame的列名和行索引創建一個新的DataFrame。該方法通常用於需要進行更加複雜的DataFrame運算時。

五、條件篩選後的轉置

在實際數據處理過程中，我們可能需要在轉置之前先對數據進行條件篩選。例如，我們有如下數據：

  name  course  score
0   aa    Math     98
1   bb    Math     97
2   aa    Eng      93
3   bb    Eng      88

如果想將該數據轉換成以下形式：

name Math Eng
aa    98  93
bb    97  88

我們可以使用pivot_table()方法進行條件篩選並轉置。

df_pivot = df.pivot_table(index='name', columns='course', values='score', aggfunc=np.sum)
df_T = df_pivot.T

pivot_table()方法的index參數指定行索引，columns參數指定列索引，values參數指定需要進行計算的數值列，aggfunc參數指定計算的方法（如sum、mean等），本例使用了np.sum方法。

六、缺失值處理

在進行行列轉置時，缺失值的處理也是需要考慮的一個問題。常見的缺失值處理方法包括：刪除、填充等。

1.刪除缺失值

dropna()方法可以刪除DataFrame中包含缺失值的行或列。例如，如果我們現在有如下數據：

   name  course  score
0  John    Math   89.0
1  John    Eng    82.0
2  Lucy    Math    NaN
3  Lucy    Eng     99.0

我們可以使用dropna()方法刪除包含缺失值的行，然後對剩餘的數據進行轉置：

df_dropna = df.dropna()
df_T = df_dropna.T

2.填充缺失值

fillna()方法可以用於填充DataFrame中的缺失值。例如，如果我們現在有如下數據：

   name  course  score
0  John    Math   89.0
1  John    Eng    82.0
2  Lucy    Math    NaN
3  Lucy    Eng     99.0

我們可以使用fillna()方法將缺失值填充為0：

df_fillna = df.fillna(0)
df_T = df_fillna.T

七、結語

本文詳細闡述了Pandas行列轉置的多個方面，包括基本使用、列名和索引、轉置的實現方式、條件篩選後的轉置、缺失值處理等。通過學習，相信讀者已了解Pandas行列轉置的相關知識，並可在實際數據處理中靈活運用。

原創文章，作者：MVFLE，如若轉載，請註明出處：https://www.506064.com/zh-hk/n/360889.html