如何使用Pandas中的isin()函數快速篩選DataFrame中的數據

一、使用isin()函數的方法

Pandas是Python中用於數據處理和分析的一個庫。其中,isin()函數是一種強大而方便的方法,可以在數據框中快速篩選出包含特定值的行。下面是使用isin()函數的示例代碼:

import pandas as pd

data = {
        'Name': ['John', 'Emily', 'Kate', 'James', 'Peter'],
        'Age': [25, 30, 18, 35, 27],
        'City': ['NYC', 'LA', 'CHI', 'LA', 'MI'],
        }

df = pd.DataFrame(data)

selected_cities = ['CHI', 'MI']

filtered_data = df[df['City'].isin(selected_cities)]

print(filtered_data)

在上面的示例中,我們使用了isin()函數來篩選數據框df中位於selected_cities列表中的城市。我們在數據框中創建了一個名為selected_cities的新列表,並將其中的值設置為我們要篩選的城市列表。然後,我們對數據框中的City列使用isin()函數。

需要注意的是,isin()函數響應的是一個布爾向量,因此我們必須將這個向量傳遞給df[]運算符,以便根據這個向量過濾數據框中的行。最後我們將篩選後的數據列印出來。

二、多條件篩選數據

isin()函數還可以與其他條件一起使用,以進行更高級別的篩選。例如,在上一個示例中,我們只選擇了兩個城市。但是如果數據框有很多列,我們可能需要同時滿足多個條件才能對數據進行篩選。以下是示例代碼:

import pandas as pd

data = {
        'Name': ['John', 'Emily', 'Kate', 'James', 'Peter'],
        'Age': [25, 30, 18, 35, 27],
        'City': ['NYC', 'LA', 'CHI', 'LA', 'MI'],
        'Salary': [80000, 120000, 45000, 150000, 90000]
        }

df = pd.DataFrame(data)

selected_cities = ['CHI', 'MI']
min_salary = 100000

filtered_data = df[(df['City'].isin(selected_cities)) & (df['Salary'] > min_salary)]

print(filtered_data)

這裡,我們將數據框擴展為包括每個人的薪水。我們設置了一個名為min_salary的變數,以便在使用isin()函數進行篩選之前先篩選出具有所需最低薪水的人。我們使用了邏輯運算符&,將兩個條件結合在一起,僅保留滿足以下條件的行:City列包含selected_cities列表中的任意一個城市,且Salary列中的值大於min_salary。

三、如何處理篩選不到數據的情況

在某些情況下,篩選後的數據框可能為空,因為我們指定的條件與數據框中的任何行都不匹配。在這種情況下,我們可以使用empty屬性檢查篩選後的數據框是否為空,從而避免出現錯誤。

以下是示例代碼:

import pandas as pd

data = {
        'Name': ['John', 'Emily', 'Kate', 'James', 'Peter'],
        'Age': [25, 30, 18, 35, 27],
        'City': ['NYC', 'LA', 'CHI', 'LA', 'MI'],
        'Salary': [80000, 120000, 45000, 150000, 90000]
        }

df = pd.DataFrame(data)

selected_cities = ['DC', 'Boston']
min_salary = 50000

filtered_data = df[(df['City'].isin(selected_cities)) & (df['Salary'] > min_salary)]

if filtered_data.empty:
    print('No data meets the selected criteria')
else:
    print(filtered_data)

我們設置了selected_cities變數和min_salary變數,並將它們與數據框中的數據進行比較。在上面的示例中,我們設置的城市和薪水條件使篩選後的數據框為空,因此我們使用empty屬性輸出「No data meets the selected criteria」字元串。否則輸出篩選後的數據。

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/250972.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-12-13 13:31
下一篇 2024-12-13 13:31

相關推薦

  • Python中引入上一級目錄中函數

    Python中經常需要調用其他文件夾中的模塊或函數,其中一個常見的操作是引入上一級目錄中的函數。在此,我們將從多個角度詳細解釋如何在Python中引入上一級目錄的函數。 一、加入環…

    編程 2025-04-29
  • Python讀取CSV數據畫散點圖

    本文將從以下方面詳細闡述Python讀取CSV文件並畫出散點圖的方法: 一、CSV文件介紹 CSV(Comma-Separated Values)即逗號分隔值,是一種存儲表格數據的…

    編程 2025-04-29
  • Python中capitalize函數的使用

    在Python的字元串操作中,capitalize函數常常被用到,這個函數可以使字元串中的第一個單詞首字母大寫,其餘字母小寫。在本文中,我們將從以下幾個方面對capitalize函…

    編程 2025-04-29
  • Ojlat:一款快速開發Web應用程序的框架

    Ojlat是一款用於快速開發Web應用程序的框架。它的主要特點是高效、易用、可擴展且功能齊全。通過Ojlat,開發人員可以輕鬆地構建出高質量的Web應用程序。本文將從多個方面對Oj…

    編程 2025-04-29
  • Python中set函數的作用

    Python中set函數是一個有用的數據類型,可以被用於許多編程場景中。在這篇文章中,我們將學習Python中set函數的多個方面,從而深入了解這個函數在Python中的用途。 一…

    編程 2025-04-29
  • 單片機列印函數

    單片機列印是指通過串口或並口將一些數據列印到終端設備上。在單片機應用中,列印非常重要。正確的列印數據可以讓我們知道單片機運行的狀態,方便我們進行調試;錯誤的列印數據可以幫助我們快速…

    編程 2025-04-29
  • Python中讀入csv文件數據的方法用法介紹

    csv是一種常見的數據格式,通常用於存儲小型數據集。Python作為一種廣泛流行的編程語言,內置了許多操作csv文件的庫。本文將從多個方面詳細介紹Python讀入csv文件的方法。…

    編程 2025-04-29
  • 三角函數用英語怎麼說

    三角函數,即三角比函數,是指在一個銳角三角形中某一角的對邊、鄰邊之比。在數學中,三角函數包括正弦、餘弦、正切等,它們在數學、物理、工程和計算機等領域都得到了廣泛的應用。 一、正弦函…

    編程 2025-04-29
  • 如何使用Python獲取某一行

    您可能經常會遇到需要處理文本文件數據的情況,在這種情況下,我們需要從文本文件中獲取特定一行的數據並對其進行處理。Python提供了許多方法來讀取和處理文本文件中的數據,而在本文中,…

    編程 2025-04-29
  • Python3定義函數參數類型

    Python是一門動態類型語言,不需要在定義變數時顯示的指定變數類型,但是Python3中提供了函數參數類型的聲明功能,在函數定義時明確定義參數類型。在函數的形參後面加上冒號(:)…

    編程 2025-04-29

發表回復

登錄後才能評論