Pandas 行列轉換的完全指南

一、基礎概念

在介紹 Pandas 行列轉換的各種方法之前,我們需要了解一些基礎概念。Pandas 中最重要的兩個數據結構是 Series 和 DataFrame。Series 是一維數組,它由值和索引組成。DataFrame 是二維表格,它由多個列和行組成。

在 DataFrame 中,我們通常會遇到兩種類型的轉換:行轉列和列轉行。行轉列指的是將 DataFrame 中的一些行數據轉換成新的列,而列轉行則相反,將多列數據轉換成一些新的行。

二、行轉列

1. stack()

import pandas as pd

df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
                   'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
                   'C': [1, 2, 3, 4, 5, 6, 7, 8],
                   'D': [9, 10, 11, 12, 13, 14, 15, 16]})
stacked = df.set_index(['A', 'B']).stack()
print(stacked)

使用 stack() 方法可以將 DataFrame 中的列轉換成多層索引的 Series。在上面的例子中,我們首先使用 set_index() 方法將 A 和 B 列設置為索引,然後使用 stack() 方法將 C 和 D 列轉換成多層索引的 Series。

2. melt()

import pandas as pd

df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
                   'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
                   'C': [1, 2, 3, 4, 5, 6, 7, 8],
                   'D': [9, 10, 11, 12, 13, 14, 15, 16]})
melted = df.melt(id_vars=['A', 'B'], value_vars=['C', 'D'])
print(melted)

使用 melt() 方法可以將 DataFrame 中的多列數據轉換成一些新的行,其中需要指定 value_vars 和 id_vars 兩個參數。value_vars 代表要轉換的列,id_vars 代表保持不變的列。在上面的例子中,我們將 C 和 D 列轉換成了新的一列,並保留了 A 和 B 列。

三、列轉行

1. transpose()

import pandas as pd

df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
                   'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
                   'C': [1, 2, 3, 4, 5, 6, 7, 8],
                   'D': [9, 10, 11, 12, 13, 14, 15, 16]})
transposed = df.transpose()
print(transposed)

使用 transpose() 方法可以將 DataFrame 中的行和列交換。在上面的例子中,我們將原來的列轉換成了新的行。

2. pivot()

import pandas as pd

df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
                   'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
                   'C': [1, 2, 3, 4, 5, 6, 7, 8],
                   'D': [9, 10, 11, 12, 13, 14, 15, 16]})
pivoted = df.pivot(index='A', columns='B', values='C')
print(pivoted)

使用 pivot() 方法可以將 DataFrame 中的某些列轉換成新的行和列。其中,index 參數代表新 DataFrame 的行索引,columns 參數代表新 DataFrame 的列索引,values 參數代表填充新 DataFrame 的值。在上面的例子中,我們將原 DataFrame 中的 A 列作為新 DataFrame 的行索引,B 列作為新 DataFrame 的列索引,C 列作為新 DataFrame 的值。

四、其他方法

1. wide_to_long()

import pandas as pd

df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
                   'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
                   'C_1': [1, 2, 3, 4, 5, 6, 7, 8],
                   'C_2': [9, 10, 11, 12, 13, 14, 15, 16]})
long = pd.wide_to_long(df, stubnames='C', i=['A', 'B'], j='number')
print(long)

使用 wide_to_long() 方法可以將 DataFrame 中的寬格式數據轉換成長格式數據。其中,stubnames 參數代表列名中的前綴,i 參數代表保留的列,j 參數代表新生成的列名。在上面的例子中,我們將原 DataFrame 中的 C_1 和 C_2 列轉換成了新的一列,用 number 作為列名。

2. pivot_table()

import pandas as pd

df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
                   'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
                   'C': [1, 2, 3, 4, 5, 6, 7, 8],
                   'D': [9, 10, 11, 12, 13, 14, 15, 16]})
pivoted_table = df.pivot_table(values='C', index='A', columns='B', aggfunc=np.sum)
print(pivoted_table)

使用 pivot_table() 方法可以對 DataFrame 進行聚合,並將結果以新的行列形式返回。其中,values 參數代表需要聚合的列,index 參數代表行索引,columns 參數代表列索引,aggfunc 參數代表聚合函數。在上面的例子中,我們對列 C 進行了 sum 聚合,以 A 列作為行索引,B 列作為列索引。

五、總結

本篇文章介紹了 Pandas 行列轉換的常見方法,包括 stack、melt、transpose、pivot、wide_to_long 和 pivot_table。行列轉換是數據分析和數據清洗中的常見操作,熟練掌握這些方法可以幫助我們更加高效地處理數據。希望本文能夠幫助到大家。

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/303604.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-12-31 11:50
下一篇 2024-12-31 11:50

相關推薦

  • Java JsonPath 效率優化指南

    本篇文章將深入探討Java JsonPath的效率問題,並提供一些優化方案。 一、JsonPath 簡介 JsonPath是一個可用於從JSON數據中獲取信息的庫。它提供了一種DS…

    編程 2025-04-29
  • 運維Python和GO應用實踐指南

    本文將從多個角度詳細闡述運維Python和GO的實際應用,包括監控、管理、自動化、部署、持續集成等方面。 一、監控 運維中的監控是保證系統穩定性的重要手段。Python和GO都有強…

    編程 2025-04-29
  • Python wordcloud入門指南

    如何在Python中使用wordcloud庫生成文字雲? 一、安裝和導入wordcloud庫 在使用wordcloud前,需要保證庫已經安裝並導入: !pip install wo…

    編程 2025-04-29
  • Python應用程序的全面指南

    Python是一種功能強大而簡單易學的編程語言,適用於多種應用場景。本篇文章將從多個方面介紹Python如何應用於開發應用程序。 一、Web應用程序 目前,基於Python的Web…

    編程 2025-04-29
  • Python小波分解入門指南

    本文將介紹Python小波分解的概念、基本原理和實現方法,幫助初學者掌握相關技能。 一、小波變換概述 小波分解是一種廣泛應用於數字信號處理和圖像處理的方法,可以將信號分解成多個具有…

    編程 2025-04-29
  • Python字符轉列表指南

    Python是一個極為流行的腳本語言,在數據處理、數據分析、人工智能等領域廣泛應用。在很多場景下需要將字符串轉換為列表,以便於操作和處理,本篇文章將從多個方面對Python字符轉列…

    編程 2025-04-29
  • Python初學者指南:第一個Python程序安裝步驟

    在本篇指南中,我們將通過以下方式來詳細講解第一個Python程序安裝步驟: Python的安裝和環境配置 在命令行中編寫和運行第一個Python程序 使用IDE編寫和運行第一個Py…

    編程 2025-04-29
  • Python起筆落筆全能開發指南

    Python起筆落筆是指在編寫Python代碼時的編寫習慣。一個好的起筆落筆習慣可以提高代碼的可讀性、可維護性和可擴展性,本文將從多個方面進行詳細闡述。 一、變量命名 變量命名是起…

    編程 2025-04-29
  • FusionMaps應用指南

    FusionMaps是一款基於JavaScript和Flash的交互式地圖可視化工具。它提供了一種簡單易用的方式,將複雜的數據可視化為地圖。本文將從基礎的配置開始講解,到如何定製和…

    編程 2025-04-29
  • Python中文版下載官網的完整指南

    Python是一種廣泛使用的編程語言,具有簡潔、易讀易寫等特點。Python中文版下載官網是Python學習和使用過程中的重要資源,本文將從多個方面對Python中文版下載官網進行…

    編程 2025-04-29

發表回復

登錄後才能評論