如何使用Pandas中的isin()函数快速筛选DataFrame中的数据

一、使用isin()函数的方法

Pandas是Python中用于数据处理和分析的一个库。其中,isin()函数是一种强大而方便的方法,可以在数据框中快速筛选出包含特定值的行。下面是使用isin()函数的示例代码:

import pandas as pd

data = {
        'Name': ['John', 'Emily', 'Kate', 'James', 'Peter'],
        'Age': [25, 30, 18, 35, 27],
        'City': ['NYC', 'LA', 'CHI', 'LA', 'MI'],
        }

df = pd.DataFrame(data)

selected_cities = ['CHI', 'MI']

filtered_data = df[df['City'].isin(selected_cities)]

print(filtered_data)

在上面的示例中,我们使用了isin()函数来筛选数据框df中位于selected_cities列表中的城市。我们在数据框中创建了一个名为selected_cities的新列表,并将其中的值设置为我们要筛选的城市列表。然后,我们对数据框中的City列使用isin()函数。

需要注意的是,isin()函数响应的是一个布尔向量,因此我们必须将这个向量传递给df[]运算符,以便根据这个向量过滤数据框中的行。最后我们将筛选后的数据打印出来。

二、多条件筛选数据

isin()函数还可以与其他条件一起使用,以进行更高级别的筛选。例如,在上一个示例中,我们只选择了两个城市。但是如果数据框有很多列,我们可能需要同时满足多个条件才能对数据进行筛选。以下是示例代码:

import pandas as pd

data = {
        'Name': ['John', 'Emily', 'Kate', 'James', 'Peter'],
        'Age': [25, 30, 18, 35, 27],
        'City': ['NYC', 'LA', 'CHI', 'LA', 'MI'],
        'Salary': [80000, 120000, 45000, 150000, 90000]
        }

df = pd.DataFrame(data)

selected_cities = ['CHI', 'MI']
min_salary = 100000

filtered_data = df[(df['City'].isin(selected_cities)) & (df['Salary'] > min_salary)]

print(filtered_data)

这里,我们将数据框扩展为包括每个人的薪水。我们设置了一个名为min_salary的变量,以便在使用isin()函数进行筛选之前先筛选出具有所需最低薪水的人。我们使用了逻辑运算符&,将两个条件结合在一起,仅保留满足以下条件的行:City列包含selected_cities列表中的任意一个城市,且Salary列中的值大于min_salary。

三、如何处理筛选不到数据的情况

在某些情况下,筛选后的数据框可能为空,因为我们指定的条件与数据框中的任何行都不匹配。在这种情况下,我们可以使用empty属性检查筛选后的数据框是否为空,从而避免出现错误。

以下是示例代码:

import pandas as pd

data = {
        'Name': ['John', 'Emily', 'Kate', 'James', 'Peter'],
        'Age': [25, 30, 18, 35, 27],
        'City': ['NYC', 'LA', 'CHI', 'LA', 'MI'],
        'Salary': [80000, 120000, 45000, 150000, 90000]
        }

df = pd.DataFrame(data)

selected_cities = ['DC', 'Boston']
min_salary = 50000

filtered_data = df[(df['City'].isin(selected_cities)) & (df['Salary'] > min_salary)]

if filtered_data.empty:
    print('No data meets the selected criteria')
else:
    print(filtered_data)

我们设置了selected_cities变量和min_salary变量,并将它们与数据框中的数据进行比较。在上面的示例中,我们设置的城市和薪水条件使筛选后的数据框为空,因此我们使用empty属性输出“No data meets the selected criteria”字符串。否则输出筛选后的数据。

原创文章,作者:小蓝,如若转载,请注明出处:https://www.506064.com/n/250972.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
小蓝小蓝
上一篇 2024-12-13 13:31
下一篇 2024-12-13 13:31

相关推荐

  • Python中引入上一级目录中函数

    Python中经常需要调用其他文件夹中的模块或函数,其中一个常见的操作是引入上一级目录中的函数。在此,我们将从多个角度详细解释如何在Python中引入上一级目录的函数。 一、加入环…

    编程 2025-04-29
  • Python读取CSV数据画散点图

    本文将从以下方面详细阐述Python读取CSV文件并画出散点图的方法: 一、CSV文件介绍 CSV(Comma-Separated Values)即逗号分隔值,是一种存储表格数据的…

    编程 2025-04-29
  • Python中capitalize函数的使用

    在Python的字符串操作中,capitalize函数常常被用到,这个函数可以使字符串中的第一个单词首字母大写,其余字母小写。在本文中,我们将从以下几个方面对capitalize函…

    编程 2025-04-29
  • Ojlat:一款快速开发Web应用程序的框架

    Ojlat是一款用于快速开发Web应用程序的框架。它的主要特点是高效、易用、可扩展且功能齐全。通过Ojlat,开发人员可以轻松地构建出高质量的Web应用程序。本文将从多个方面对Oj…

    编程 2025-04-29
  • Python中set函数的作用

    Python中set函数是一个有用的数据类型,可以被用于许多编程场景中。在这篇文章中,我们将学习Python中set函数的多个方面,从而深入了解这个函数在Python中的用途。 一…

    编程 2025-04-29
  • 单片机打印函数

    单片机打印是指通过串口或并口将一些数据打印到终端设备上。在单片机应用中,打印非常重要。正确的打印数据可以让我们知道单片机运行的状态,方便我们进行调试;错误的打印数据可以帮助我们快速…

    编程 2025-04-29
  • Python中读入csv文件数据的方法用法介绍

    csv是一种常见的数据格式,通常用于存储小型数据集。Python作为一种广泛流行的编程语言,内置了许多操作csv文件的库。本文将从多个方面详细介绍Python读入csv文件的方法。…

    编程 2025-04-29
  • 三角函数用英语怎么说

    三角函数,即三角比函数,是指在一个锐角三角形中某一角的对边、邻边之比。在数学中,三角函数包括正弦、余弦、正切等,它们在数学、物理、工程和计算机等领域都得到了广泛的应用。 一、正弦函…

    编程 2025-04-29
  • 如何使用Python获取某一行

    您可能经常会遇到需要处理文本文件数据的情况,在这种情况下,我们需要从文本文件中获取特定一行的数据并对其进行处理。Python提供了许多方法来读取和处理文本文件中的数据,而在本文中,…

    编程 2025-04-29
  • Python3定义函数参数类型

    Python是一门动态类型语言,不需要在定义变量时显示的指定变量类型,但是Python3中提供了函数参数类型的声明功能,在函数定义时明确定义参数类型。在函数的形参后面加上冒号(:)…

    编程 2025-04-29

发表回复

登录后才能评论