Python實現唯一值去重的方法

在處理數據時，有時候需要去重操作，即保留唯一值並刪除重複值。Python作為一門廣泛應用於數據處理的編程語言，提供了多種方法用於實現唯一值的去重。本文將介紹幾種方法，並且給出對應的代碼示例。

一、使用set()函數實現唯一值去重

Python內置的set()函數可以用於對一個序列進行去重操作。set()函數會將序列中的元素轉換為一個無序、不重複、可進行集合操作的集合。使用set()函數實現去重操作非常簡單，只需要將原序列傳入set()函數即可。

list1 = [1, 2, 3, 4, 3, 2, 1]
unique_list = set(list1)
print(unique_list)

輸出結果為：

{1, 2, 3, 4}

使用set()函數可以去重任何可迭代對象，例如列表、元組、字符串和字典的鍵等。

二、使用dict.fromkeys()實現唯一值去重

dict.fromkeys()函數用於創建一個新字典，並指定其中的鍵，值默認為None。由於字典中的鍵是不可重複的，因此使用dict.fromkeys()函數實現唯一值去重也是一種較為簡單的方法。需要注意的是，dict.fromkeys()函數只能用於可哈希對象去重，例如整數和字符串等。對於列表、字典等不可哈希對象，不能使用此方法進行去重操作。

list2 = [1, 2, 3, 4, 3, 2, 1]
unique_list2 = list(dict.fromkeys(list2))
print(unique_list2)

輸出結果為：

[1, 2, 3, 4]

三、使用列表推導式實現唯一值去重

列表推導式是Python中一種方便簡潔的語法，可以通過一行代碼實現複雜的列表操作。在列表推導式中，可以使用if語句來實現過濾操作。因此，我們可以利用列表推導式實現唯一值去重。

list3 = [1, 2, 3, 4, 3, 2, 1]
unique_list3 = []
[unique_list3.append(i) for i in list3 if i not in unique_list3]
print(unique_list3)

輸出結果為：

[1, 2, 3, 4]

使用列表推導式的優點是代碼簡潔，適用於小規模數據集的去重操作。但是，對於大規模數據集，使用列表推導式會佔用過多的內存，因此需要謹慎使用。

四、使用pandas庫實現唯一值去重

pandas是Python中用於數據處理和分析的庫，在對數據進行去重操作時也提供了多種方法。使用pandas庫可以在處理複雜數據時實現高效的去重操作。

import pandas as pd
list4 = [1, 2, 3, 4, 3, 2, 1]
s = pd.Series(list4)
unique_s = s.drop_duplicates()
print(unique_s)

輸出結果為：

0    1
1    2
2    3
3    4
dtype: int64

pandas庫提供了很多方法用於實現數據操作，例如在此代碼中使用的Series()函數創建一個pandas中Series類型的數據結構，而drop_duplicates()函數用於去除Series中的重複值。

總結

本文介紹了Python中實現唯一值去重的多種方法，包括使用set()函數、dict.fromkeys()函數、列表推導式和pandas庫等。在實際應用中，根據不同的數據特徵和操作需求，可以選擇不同的方法進行數據去重操作。

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-hant/n/295983.html

Python實現唯一值去重的方法

一、使用set()函數實現唯一值去重

二、使用dict.fromkeys()實現唯一值去重

三、使用列表推導式實現唯一值去重

四、使用pandas庫實現唯一值去重

總結

相關推薦

發表回復