Python DataFrame相关操作

一、创建DataFrame

在使用pandas库进行数据分析时,首先需要创建DataFrame对象。DataFrame可以看作是一张数据库表格或者电子表格,其中包含了多个Series。我们可以使用列表、字典等数据结构作为DataFrame的数据源来创建DataFrame。

import pandas as pd

# 使用列表创建DataFrame
data = [['Tom', 25], ['Jerry', 30], ['Mike', 28]]
df = pd.DataFrame(data, columns=['Name', 'Age'])
print(df)

# 使用字典创建DataFrame
data = {'Name': ['Tom', 'Jerry', 'Mike'], 'Age': [25, 30, 28]}
df = pd.DataFrame(data)
print(df)

二、数据选取和切片

对于DataFrame对象,我们可以通过列名选取对应的列,也可以通过行索引选取对应的行或者使用切片选取一块区域。同时也可以使用loc和iloc方法实现更加灵活的选取。

# 列选取
df['Name']
df.Name

# 行选取
df.loc[0]
df.iloc[0]

# 切片选取
df.loc[0:1, 'Name':'Age']
df.iloc[0:2, 0:2]

三、数据过滤和排序

在数据分析中,我们需要根据不同的条件对数据进行过滤,同时也需要根据不同的列对数据进行排序。

# 数据过滤
df[df.Age > 25]

# 数据排序
df.sort_values(by='Age')
df.sort_values(by=['Age', 'Name'], ascending=[True, False])

四、数据聚合和统计

在进行数据分析时,我们需要对数据进行聚合和统计,例如求和、平均值、最大值等。

# 数据聚合
df.groupby(by='Age').sum()

# 数据统计
df.describe()
df.count()
df.mean()
df.max()

五、数据合并和拼接

在实际的数据分析中,我们需要将多个数据集合并起来或者将一个数据集拆分为多个数据集。Pandas提供了多个方法实现数据的合并和拼接。

# 数据合并
df1 = pd.DataFrame({'Name': ['Tom', 'Jerry'], 'Age': [25, 30]})
df2 = pd.DataFrame({'Name': ['Mike', 'Jerry'], 'Salary': [5000, 6000]})
pd.merge(df1, df2, on='Name', how='inner')

# 数据拼接
pd.concat([df1, df2], axis=1)

六、数据可视化

通过数据可视化,我们可以更加直观地展示数据分析结果,为决策提供依据。Pandas提供了多个方法实现数据可视化,例如plot方法、hist方法、scatter方法等。

# 数据可视化
df.plot.bar(x='Name', y='Age')
df.plot.hist(bins=10)
df.plot.scatter(x='Age', y='Salary')

以上就是Python DataFrame相关操作的介绍,希望能够帮助大家更好地使用Pandas进行数据分析和处理。

原创文章,作者:小蓝,如若转载,请注明出处:https://www.506064.com/n/193823.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
小蓝小蓝
上一篇 2024-12-02 09:40
下一篇 2024-12-02 09:40

相关推荐

  • 如何查看Anaconda中Python路径

    对Anaconda中Python路径即conda环境的查看进行详细的阐述。 一、使用命令行查看 1、在Windows系统中,可以使用命令提示符(cmd)或者Anaconda Pro…

    编程 2025-04-29
  • Python周杰伦代码用法介绍

    本文将从多个方面对Python周杰伦代码进行详细的阐述。 一、代码介绍 from urllib.request import urlopen from bs4 import Bea…

    编程 2025-04-29
  • Python中引入上一级目录中函数

    Python中经常需要调用其他文件夹中的模块或函数,其中一个常见的操作是引入上一级目录中的函数。在此,我们将从多个角度详细解释如何在Python中引入上一级目录的函数。 一、加入环…

    编程 2025-04-29
  • Python列表中负数的个数

    Python列表是一个有序的集合,可以存储多个不同类型的元素。而负数是指小于0的整数。在Python列表中,我们想要找到负数的个数,可以通过以下几个方面进行实现。 一、使用循环遍历…

    编程 2025-04-29
  • Python计算阳历日期对应周几

    本文介绍如何通过Python计算任意阳历日期对应周几。 一、获取日期 获取日期可以通过Python内置的模块datetime实现,示例代码如下: from datetime imp…

    编程 2025-04-29
  • Python字典去重复工具

    使用Python语言编写字典去重复工具,可帮助用户快速去重复。 一、字典去重复工具的需求 在使用Python编写程序时,我们经常需要处理数据文件,其中包含了大量的重复数据。为了方便…

    编程 2025-04-29
  • Python清华镜像下载

    Python清华镜像是一个高质量的Python开发资源镜像站,提供了Python及其相关的开发工具、框架和文档的下载服务。本文将从以下几个方面对Python清华镜像下载进行详细的阐…

    编程 2025-04-29
  • Python程序需要编译才能执行

    Python 被广泛应用于数据分析、人工智能、科学计算等领域,它的灵活性和简单易学的性质使得越来越多的人喜欢使用 Python 进行编程。然而,在 Python 中程序执行的方式不…

    编程 2025-04-29
  • 蝴蝶优化算法Python版

    蝴蝶优化算法是一种基于仿生学的优化算法,模仿自然界中的蝴蝶进行搜索。它可以应用于多个领域的优化问题,包括数学优化、工程问题、机器学习等。本文将从多个方面对蝴蝶优化算法Python版…

    编程 2025-04-29
  • python强行终止程序快捷键

    本文将从多个方面对python强行终止程序快捷键进行详细阐述,并提供相应代码示例。 一、Ctrl+C快捷键 Ctrl+C快捷键是在终端中经常用来强行终止运行的程序。当你在终端中运行…

    编程 2025-04-29

发表回复

登录后才能评论