Pandas 行列转换的完全指南

一、基础概念

在介绍 Pandas 行列转换的各种方法之前,我们需要了解一些基础概念。Pandas 中最重要的两个数据结构是 Series 和 DataFrame。Series 是一维数组,它由值和索引组成。DataFrame 是二维表格,它由多个列和行组成。

在 DataFrame 中,我们通常会遇到两种类型的转换:行转列和列转行。行转列指的是将 DataFrame 中的一些行数据转换成新的列,而列转行则相反,将多列数据转换成一些新的行。

二、行转列

1. stack()

import pandas as pd

df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
                   'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
                   'C': [1, 2, 3, 4, 5, 6, 7, 8],
                   'D': [9, 10, 11, 12, 13, 14, 15, 16]})
stacked = df.set_index(['A', 'B']).stack()
print(stacked)

使用 stack() 方法可以将 DataFrame 中的列转换成多层索引的 Series。在上面的例子中,我们首先使用 set_index() 方法将 A 和 B 列设置为索引,然后使用 stack() 方法将 C 和 D 列转换成多层索引的 Series。

2. melt()

import pandas as pd

df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
                   'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
                   'C': [1, 2, 3, 4, 5, 6, 7, 8],
                   'D': [9, 10, 11, 12, 13, 14, 15, 16]})
melted = df.melt(id_vars=['A', 'B'], value_vars=['C', 'D'])
print(melted)

使用 melt() 方法可以将 DataFrame 中的多列数据转换成一些新的行,其中需要指定 value_vars 和 id_vars 两个参数。value_vars 代表要转换的列,id_vars 代表保持不变的列。在上面的例子中,我们将 C 和 D 列转换成了新的一列,并保留了 A 和 B 列。

三、列转行

1. transpose()

import pandas as pd

df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
                   'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
                   'C': [1, 2, 3, 4, 5, 6, 7, 8],
                   'D': [9, 10, 11, 12, 13, 14, 15, 16]})
transposed = df.transpose()
print(transposed)

使用 transpose() 方法可以将 DataFrame 中的行和列交换。在上面的例子中,我们将原来的列转换成了新的行。

2. pivot()

import pandas as pd

df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
                   'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
                   'C': [1, 2, 3, 4, 5, 6, 7, 8],
                   'D': [9, 10, 11, 12, 13, 14, 15, 16]})
pivoted = df.pivot(index='A', columns='B', values='C')
print(pivoted)

使用 pivot() 方法可以将 DataFrame 中的某些列转换成新的行和列。其中,index 参数代表新 DataFrame 的行索引,columns 参数代表新 DataFrame 的列索引,values 参数代表填充新 DataFrame 的值。在上面的例子中,我们将原 DataFrame 中的 A 列作为新 DataFrame 的行索引,B 列作为新 DataFrame 的列索引,C 列作为新 DataFrame 的值。

四、其他方法

1. wide_to_long()

import pandas as pd

df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
                   'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
                   'C_1': [1, 2, 3, 4, 5, 6, 7, 8],
                   'C_2': [9, 10, 11, 12, 13, 14, 15, 16]})
long = pd.wide_to_long(df, stubnames='C', i=['A', 'B'], j='number')
print(long)

使用 wide_to_long() 方法可以将 DataFrame 中的宽格式数据转换成长格式数据。其中,stubnames 参数代表列名中的前缀,i 参数代表保留的列,j 参数代表新生成的列名。在上面的例子中,我们将原 DataFrame 中的 C_1 和 C_2 列转换成了新的一列,用 number 作为列名。

2. pivot_table()

import pandas as pd

df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
                   'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
                   'C': [1, 2, 3, 4, 5, 6, 7, 8],
                   'D': [9, 10, 11, 12, 13, 14, 15, 16]})
pivoted_table = df.pivot_table(values='C', index='A', columns='B', aggfunc=np.sum)
print(pivoted_table)

使用 pivot_table() 方法可以对 DataFrame 进行聚合,并将结果以新的行列形式返回。其中,values 参数代表需要聚合的列,index 参数代表行索引,columns 参数代表列索引,aggfunc 参数代表聚合函数。在上面的例子中,我们对列 C 进行了 sum 聚合,以 A 列作为行索引,B 列作为列索引。

五、总结

本篇文章介绍了 Pandas 行列转换的常见方法,包括 stack、melt、transpose、pivot、wide_to_long 和 pivot_table。行列转换是数据分析和数据清洗中的常见操作,熟练掌握这些方法可以帮助我们更加高效地处理数据。希望本文能够帮助到大家。

原创文章,作者:小蓝,如若转载,请注明出处:https://www.506064.com/n/303604.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
小蓝小蓝
上一篇 2024-12-31 11:50
下一篇 2024-12-31 11:50

相关推荐

  • Java JsonPath 效率优化指南

    本篇文章将深入探讨Java JsonPath的效率问题,并提供一些优化方案。 一、JsonPath 简介 JsonPath是一个可用于从JSON数据中获取信息的库。它提供了一种DS…

    编程 2025-04-29
  • 运维Python和GO应用实践指南

    本文将从多个角度详细阐述运维Python和GO的实际应用,包括监控、管理、自动化、部署、持续集成等方面。 一、监控 运维中的监控是保证系统稳定性的重要手段。Python和GO都有强…

    编程 2025-04-29
  • Python wordcloud入门指南

    如何在Python中使用wordcloud库生成文字云? 一、安装和导入wordcloud库 在使用wordcloud前,需要保证库已经安装并导入: !pip install wo…

    编程 2025-04-29
  • Python应用程序的全面指南

    Python是一种功能强大而简单易学的编程语言,适用于多种应用场景。本篇文章将从多个方面介绍Python如何应用于开发应用程序。 一、Web应用程序 目前,基于Python的Web…

    编程 2025-04-29
  • Python小波分解入门指南

    本文将介绍Python小波分解的概念、基本原理和实现方法,帮助初学者掌握相关技能。 一、小波变换概述 小波分解是一种广泛应用于数字信号处理和图像处理的方法,可以将信号分解成多个具有…

    编程 2025-04-29
  • Python字符转列表指南

    Python是一个极为流行的脚本语言,在数据处理、数据分析、人工智能等领域广泛应用。在很多场景下需要将字符串转换为列表,以便于操作和处理,本篇文章将从多个方面对Python字符转列…

    编程 2025-04-29
  • Python初学者指南:第一个Python程序安装步骤

    在本篇指南中,我们将通过以下方式来详细讲解第一个Python程序安装步骤: Python的安装和环境配置 在命令行中编写和运行第一个Python程序 使用IDE编写和运行第一个Py…

    编程 2025-04-29
  • Python起笔落笔全能开发指南

    Python起笔落笔是指在编写Python代码时的编写习惯。一个好的起笔落笔习惯可以提高代码的可读性、可维护性和可扩展性,本文将从多个方面进行详细阐述。 一、变量命名 变量命名是起…

    编程 2025-04-29
  • FusionMaps应用指南

    FusionMaps是一款基于JavaScript和Flash的交互式地图可视化工具。它提供了一种简单易用的方式,将复杂的数据可视化为地图。本文将从基础的配置开始讲解,到如何定制和…

    编程 2025-04-29
  • Python中文版下载官网的完整指南

    Python是一种广泛使用的编程语言,具有简洁、易读易写等特点。Python中文版下载官网是Python学习和使用过程中的重要资源,本文将从多个方面对Python中文版下载官网进行…

    编程 2025-04-29

发表回复

登录后才能评论