掌握pd.read_csv,轻松读取数据文件

一、pd.read_csv参数

import pandas as pd

# 读取CSV文件
df = pd.read_csv('data.csv')

# 打印读取到的数据
print(df)

pd.read_csv函数是pandas模块提供的一种从文件、URL或任何一个支持缓存协议的文件中加载数据的方式。读取CSV文件时,可以指定很多参数,使得读取的数据满足我们的需求。

1、filepath_or_buffer

# 读取CSV文件
df = pd.read_csv('data.csv')

# 读取CSV文件的第2到第4行
df = pd.read_csv('data.csv', skiprows=1, nrows=3)

filepath_or_buffer是必选的参数,指定要读取的文件。可以是本地文件路径,也可以是URL,还可以是任何一个支持缓存协议的文件。

同时,通过skiprows和nrows参数,还可以控制读取的行数。

2、sep

# 读取分号分隔符的CSV文件
df = pd.read_csv('data.csv', sep=';')

sep参数用于指定分隔符,默认使用逗号作为分隔符。如果文件使用的是其他分隔符,需要手动指定。

3、header

# 读取无表头的CSV文件
df = pd.read_csv('data.csv', header=None)

# 使用指定行作为表头
df = pd.read_csv('data.csv', header=2)

header参数用于指定CSV文件是否有表头。当CSV文件有表头时,可以使用header=0或header=’infer’自动推断表头。如果文件没有表头,可以使用header=None,也可以使用header指定表头行的编号。

4、usecols

# 读取指定列
df = pd.read_csv('data.csv', usecols=['col1', 'col3'])

# 读取某几列并改名
df = pd.read_csv('data.csv', usecols=['col1', 'col3'], names=['col_one', 'col_three'])

usecols参数用于指定读取的列。可以传入一个列表,也可以直接传入列名的字符串。

如果需要对读取到的列名进行修改,可以使用names参数。

5、encoding

# 读取使用GBK编码的CSV文件
df = pd.read_csv('data.csv', encoding='GBK')

encoding参数用于指定CSV文件的编码格式,常见的编码格式包括UTF-8和GBK等。

二、pd.read_csv读取指定的行数和列

# 读取CSV文件
df = pd.read_csv('data.csv')

# 读取前5行
df.head(5)

# 读取后5行
df.tail(5)

# 读取第1列
df['col1']

pd.read_csv默认会读取文件的所有行和所有列,但有时候我们只需要读取其中的一部分,可以使用head、tail和列名的方式来读取指定的行数和列。

三、pd.read_csv能读什么格式

pd.read_csv函数支持读取多种格式的文本文件,包括CSV、TSV、TXT等。其中,CSV文件是pd.read_csv最常用的格式。

1、CSV格式

# 读取以逗号分隔的CSV文件
df = pd.read_csv('data.csv')

2、TSV格式

# 读取以制表符分隔的TSV文件
df = pd.read_csv('data.tsv', sep='\t')

3、TXT格式

# 读取以空格分隔的TXT文件
df = pd.read_csv('data.txt', delim_whitespace=True)

无论是哪种格式的文本文件,在使用pd.read_csv函数读取之前,都需要确定文件的分隔符、表头、编码格式等重要参数。

四、小结

pd.read_csv是pandas模块提供的一种方便易用的读取文本数据的方式。通过合理地使用参数,我们可以轻松地读取各种格式的文本文件,并选择读取特定的行数和列,满足我们的需求。

原创文章,作者:小蓝,如若转载,请注明出处:https://www.506064.com/n/187709.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
小蓝小蓝
上一篇 2024-11-28 06:25
下一篇 2024-11-28 06:25

相关推荐

  • Python读取CSV数据画散点图

    本文将从以下方面详细阐述Python读取CSV文件并画出散点图的方法: 一、CSV文件介绍 CSV(Comma-Separated Values)即逗号分隔值,是一种存储表格数据的…

    编程 2025-04-29
  • vue下载无后缀名的文件被加上后缀.txt,有后缀名的文件下载正常问题的解决

    本文旨在解决vue下载无后缀名的文件被加上后缀.txt,有后缀名的文件下载正常的问题,提供完整的代码示例供参考。 一、分析问题 首先,需了解vue中下载文件的情况。一般情况下,我们…

    编程 2025-04-29
  • 如何在Java中拼接OBJ格式的文件并生成完整的图像

    OBJ格式是一种用于表示3D对象的标准格式,通常由一组顶点、面和纹理映射坐标组成。在本文中,我们将讨论如何将多个OBJ文件拼接在一起,生成一个完整的3D模型。 一、读取OBJ文件 …

    编程 2025-04-29
  • 为什么用cmd运行Java时需要在文件内打开cmd为中心

    在Java开发中,我们经常会使用cmd在命令行窗口运行程序。然而,有时候我们会发现,在运行Java程序时,需要在文件内打开cmd为中心,这让很多开发者感到疑惑,那么,为什么会出现这…

    编程 2025-04-29
  • Python中读入csv文件数据的方法用法介绍

    csv是一种常见的数据格式,通常用于存储小型数据集。Python作为一种广泛流行的编程语言,内置了许多操作csv文件的库。本文将从多个方面详细介绍Python读入csv文件的方法。…

    编程 2025-04-29
  • Python程序文件的拓展

    Python是一门功能丰富、易于学习、可读性高的编程语言。Python程序文件通常以.py为文件拓展名,被广泛应用于各种领域,包括Web开发、机器学习、科学计算等。为了更好地发挥P…

    编程 2025-04-29
  • Python zipfile解压文件乱码处理

    本文主要介绍如何在Python中使用zipfile进行文件解压的处理,同时详细讨论在解压文件时可能出现的乱码问题的各种解决办法。 一、zipfile解压文件乱码问题的根本原因 在P…

    编程 2025-04-29
  • Python将矩阵存为CSV文件

    CSV文件是一种通用的文件格式,在统计学和计算机科学中非常常见,一些数据分析工具如Microsoft Excel,Google Sheets等都支持读取CSV文件。Python内置…

    编程 2025-04-29
  • Python如何导入py文件

    Python是一种开源的高级编程语言,因其易学易用和强大的生态系统而备受青睐。Python的import语句可以帮助用户将一个模块中的代码导入到另一个模块中,从而实现代码的重用。本…

    编程 2025-04-29
  • 如何用Python统计列表中各数据的方差和标准差

    本文将从多个方面阐述如何使用Python统计列表中各数据的方差和标准差, 并给出详细的代码示例。 一、什么是方差和标准差 方差是衡量数据变异程度的统计指标,它是每个数据值和该数据值…

    编程 2025-04-29

发表回复

登录后才能评论