Pandas條件篩選詳解

一、基礎條件篩選

Pandas是Python中非常常用的數據處理庫,對於數據篩選和清洗也非常方便,條件篩選就是其中一項重要的功能。

當需要從DataFrame中選擇滿足某些條件的數據,可以使用基礎條件篩選。這種篩選方式使用Boolean Indexing進行數據的選取。

import pandas as pd

#創建示例DataFrame
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie', 'David'],
                   'age': [25, 35, 17, 28],
                   'sex': ['F', 'M', 'M', 'M']})

#使用條件篩選獲取DF中年齡大於25歲的數據
df[df['age'] > 25]

以上代碼通過Boolean indexing,實現了從DataFrame中篩選出年齡大於25歲的數據。篩選條件[df[‘age’] > 25]返回了一列布爾值,對DF進行篩選時,只選取布爾值為True的行。

二、複合條件篩選

在數據處理中,可能需要使用多個條件進行篩選。使用符號”&”、”|”、”~”實現多個條件的組合篩選。

import pandas as pd

#創建示例DataFrame
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie', 'David'],
                   'age': [25, 35, 17, 28],
                   'sex': ['F', 'M', 'M', 'M']})

#使用複合條件篩選獲取DF中年齡大於25歲且性別為男性的數據
df[(df['age'] > 25) & (df['sex'] == 'M')]

以上代碼使用”&”進行了年齡大於25且性別為男性的複合條件篩選。根據Python運算優先級,使用圓括號括起每個條件的部分提高了代碼的可讀性。

三、使用isin進行多項匹配篩選

在某些情況下,需要在列表或Series中使用多項來篩選DataFrame中的數據,這時可以使用isin方法。

import pandas as pd

#創建示例DataFrame
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie', 'David'],
                   'age': [25, 35, 17, 28],
                   'sex': ['F', 'M', 'M', 'M']})

#使用isin篩選DF中sex 為 F 或 M的行
df[df['sex'].isin(['F', 'M'])]

以上代碼使用isin進行了多項條件的匹配,提高了代碼的可讀性和精簡性。

四、使用query方法進行條件篩選

在某些情況下,多個篩選條件的集成可能會使代碼變得非常複雜。這時可以使用query方法簡化代碼。

import pandas as pd

#創建示例DataFrame
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie', 'David'],
                   'age': [25, 35, 17, 28],
                   'sex': ['F', 'M', 'M', 'M']})

#使用query方法篩選DF中age大於25歲或者sex為F的行
df.query("sex=='F' or age>25")

以上代碼中,query方法將子字符串”sex == ‘F’ or age > 25″作為條件篩選,運行結果與使用&、|和()的幾乎相同。

五、使用eval方法進行高性能篩選

當需要在DataFrame中進行高性能篩選時,Pandas提供了一個eval方法。eval方法可以將表達式字符串傳遞給DataFrame.eval()方法,它會使用numexpr庫和覆蓋的算術運算符處理表達式,以獲得更快的計算結果。

import pandas as pd

#創建示例DataFrame
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie', 'David'],
                   'age': [25, 35, 17, 28],
                   'sex': ['F', 'M', 'M', 'M']})

#使用eval方法篩選DF中age大於25歲或者sex為F的行
df.eval("age > 25 or sex=='F'")

以上代碼中,使用eval()方法對包含我們要篩選的表達式字符串進行操作,得到一個符合條件的Series。

結論

通過這篇文章,我們對Pandas條件篩選的基礎知識、複合條件篩選、多項匹配篩選、query方法和eval方法進行了詳細闡述。通過掌握這些篩選技巧,我們可以更加高效地選擇和清洗數據。

原創文章,作者:HJWG,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/146727.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
HJWG的頭像HJWG
上一篇 2024-10-31 15:31
下一篇 2024-10-31 15:32

相關推薦

  • 條件運算符(?:)是什麼意思?

    條件運算符(?:)是JavaScript中的一種特殊的運算符,也是許多編程語言中相似語法的一部分。它可以允許我們在一個簡單、一行的語句中完成條件判斷和賦值操作,非常方便。 1.語法…

    編程 2025-04-29
  • Django ORM如何實現或的條件查詢

    在我們使用Django進行數據庫操作的時候,查詢條件往往不止一個,一個好的查詢語句需要考慮我們的查詢要求以及業務場景。在實際工作中,我們經常需要使用或的條件進行查詢,本文將詳細介紹…

    編程 2025-04-29
  • Pandas下載whl指南

    本篇文章將從幾個方面為大家詳細解答如何下載Pandas的whl文件。 一、Pandas簡介 Pandas是一個基於Python的軟件庫,主要用於數據分析、清洗和處理。在數據處理方面…

    編程 2025-04-28
  • 素數條件Python

    本文將對素數條件Python進行詳細闡述,介紹其概念、優缺點及應用場景。 一、概念 素數條件Python是一種基於Python語言的編程模式,其特點在於對於給定自然數$x$,判斷其…

    編程 2025-04-27
  • Python中不滿足條件重複執行的解決方法

    本文將以Python中不滿足條件重複執行為中心,從多個方面進行詳細闡述解決方法。 一、while循環 while循環是Python中常用的循環語句之一,它可以用於重複執行一段代碼,…

    編程 2025-04-27
  • 如何在Python中安裝和使用Pandas

    本文將介紹如何安裝和使用Python的Pandas庫 一、Pandas庫的介紹 Pandas是Python的一個數據分析庫,提供了許多實用的數據結構和數據分析工具,可以幫助用戶輕鬆…

    編程 2025-04-27
  • 神經網絡代碼詳解

    神經網絡作為一種人工智能技術,被廣泛應用於語音識別、圖像識別、自然語言處理等領域。而神經網絡的模型編寫,離不開代碼。本文將從多個方面詳細闡述神經網絡模型編寫的代碼技術。 一、神經網…

    編程 2025-04-25
  • Linux sync詳解

    一、sync概述 sync是Linux中一個非常重要的命令,它可以將文件系統緩存中的內容,強制寫入磁盤中。在執行sync之前,所有的文件系統更新將不會立即寫入磁盤,而是先緩存在內存…

    編程 2025-04-25
  • git config user.name的詳解

    一、為什麼要使用git config user.name? git是一個非常流行的分布式版本控制系統,很多程序員都會用到它。在使用git commit提交代碼時,需要記錄commi…

    編程 2025-04-25
  • Python輸入輸出詳解

    一、文件讀寫 Python中文件的讀寫操作是必不可少的基本技能之一。讀寫文件分別使用open()函數中的’r’和’w’參數,讀取文件…

    編程 2025-04-25

發表回復

登錄後才能評論