如何使用Python中的.isin方法

一、.isin方法介紹

Python中的.isin()方法是一種在處理Series等類型數據時常用的方法，它可以用於檢測數據中某個元素是否存在於指定序列中，返回一個布爾值。

其通用格式為：

data.isin([value1, value2, …])

其中，data代表要處理的數據，value1, value2, …為要檢測的值

.isin()方法常用於數據清洗、數據過濾和數據選擇等場景。

二、使用.isin方法進行數據過濾

.isin()方法可以用於過濾數據，即只保留特定的數值。

例如我們有一份銷售記錄數據，其中包含訂單編號、銷售日期、銷售數量等信息，我們需要篩選出銷售量在100以上的訂單，可以使用如下代碼：


import pandas as pd
sales_data = pd.read_csv('sales.csv')
q1_sales = sales_data[sales_data['銷售數量'].isin(range(100, 1000))]

以上代碼中，首先我們使用pandas庫中的pd.read_csv()方法將csv文件讀入到數據框中，然後使用.isin()方法對數據中的銷售數量進行過濾，只保留銷售數量在100到1000之間的訂單。

而數據清洗時，我們常常需要將特定的數值替換為其他數值，.isin()方法同樣可用於實現這個功能。例如，我們要將銷售量在100到1000之間的訂單的銷售數量都設為150，可以使用如下代碼：


sales_data.loc[sales_data['銷售數量'].isin(range(100, 1000)), '銷售數量'] = 150

以上代碼中，我們使用.loc[]方法選擇銷售數量在100到1000之間的訂單並將其銷售數量替換為150。

三、使用.isin方法進行數據選擇

.isin()方法也可用於選擇數據，即選擇數據中特定的數值。

例如，我們有一份學生成績單，其中包含學生姓名、科目、成績等信息，我們想要選擇數學成績為A的學生，可以使用如下代碼：


import pandas as pd
grades_data = pd.read_csv('grades.csv')
math_A_students = grades_data[grades_data['科目']=='數學'][grades_data['成績'].isin(['A'])]

以上代碼中，我們首先使用pd.read_csv()方法將csv文件讀入到數據框中，然後使用.isin()方法對數據中的成績進行選擇，只保留數學成績為A的學生。

四、使用.isin方法進行數據匹配

.isin()方法還可以用於數據之間的匹配，即檢測數據中某列的元素是否包含於另一個數據表中。

例如，我們有一份客戶信息表，其中包含客戶姓名、客戶等級等信息，現在我們需要根據客戶表中的信息，檢查某一產品的銷售情況，可以使用如下代碼：


import pandas as pd
customer_data = pd.read_csv('customer.csv')
sales_data = pd.read_csv('sales.csv')
# 將訂單和客戶表合併
merged_data = pd.merge(left=sales_data, right=customer_data, on='客戶姓名', how='left')
# 檢查銷售情況
product_sales = merged_data[merged_data['產品名稱'].isin(['某一產品'])]

以上代碼中，我們首先使用pd.read_csv()方法將客戶表和訂單表讀入到數據框中，然後使用pd.merge()方法將訂單表和客戶表根據客戶姓名列合併為一個數據表。最後，我們使用.isin()方法檢查是否有銷售某一產品的情況。

五、總結

使用Python中的.isin()方法可以在數據清洗、數據過濾、數據選擇和數據匹配等場景中發揮重要作用。在實際應用中，需要根據具體的場景選擇合適的參數和方法，進而實現高效的數據處理。

原創文章，作者：HJGT，如若轉載，請註明出處：https://www.506064.com/zh-hk/n/144076.html