Python字典列表去重

這篇文章將介紹如何使用Python對字典列表進行去重操作，並且從多個方面進行詳細的闡述。

一、基本操作

首先我們需要了解Python字典列表去重的基本操作。Python中提供了一種非常簡單的方法來去除列表中的重複元素，例如：


lst = [1, 2, 3, 1, 2, 4, 5, 3]
new_lst = list(set(lst))
print(new_lst)  # 輸出：[1, 2, 3, 4, 5]

可以看到，上述代碼將列表中的重複元素去除了，並且保留了原始列表的順序。對於字典列表來說，我們可以想到使用集合(set)來去重：


lst = [{'name': 'Tom', 'age': 20}, {'name': 'Jerry', 'age': 22}, {'name': 'Tom', 'age': 20}]
new_lst = list(set([str(dic) for dic in lst]))
new_lst = [eval(str_dic) for str_dic in new_lst]
print(new_lst)  # 輸出：[{'name': 'Tom', 'age': 20}, {'name': 'Jerry', 'age': 22}]

上述代碼通過先將字典列錶轉換成字符串列表，然後再去重的方式，得到了去重後的字典列表。但是這種方法存在一些問題，例如如果字典中包含不同的順序，同樣的元素也會被視為不同，例如{‘name’: ‘Tom’, ‘age’: 20}和{‘age’: 20, ‘name’: ‘Tom’}會被視為不同的元素。

二、自定義函數

為了解決上述問題，我們可以自定義一個函數來進行字典列表的去重操作，可以根據字典中的某個鍵來進行比較，例如比較’name’鍵：


lst = [{'name': 'Tom', 'age': 20}, {'name': 'Jerry', 'age': 22}, {'name': 'Tom', 'age': 20}]

def remove_duplicate_dicts(lst, key):
    result = []
    for dic in lst:
        if not any(d[key] == dic[key] for d in result):
            result.append(dic)
    return result

new_lst = remove_duplicate_dicts(lst, 'name')
print(new_lst)  # 輸出：[{'name': 'Tom', 'age': 20}, {'name': 'Jerry', 'age': 22}]

上述代碼中的自定義函數remove_duplicate_dicts()使用了一個for循環，逐個判斷字典是否已經在結果列表中存在，若存在則跳過，否則將其添加到結果列表中。通過傳入不同的鍵名，可以對不同的鍵進行去重操作。

三、利用Python標準庫

Python中還有一些標準庫可以方便地實現字典列表去重操作，例如利用itertools庫的groupby函數：


import itertools

lst = [{'name': 'Tom', 'age': 20}, {'name': 'Jerry', 'age': 22}, {'name': 'Tom', 'age': 20}]
sorted_lst = sorted(lst, key=lambda x: x['name'])
new_lst = [next(v) for _, v in itertools.groupby(sorted_lst, key=lambda x: x['name'])]

print(new_lst)  # 輸出：[{'name': 'Jerry', 'age': 22}, {'name': 'Tom', 'age': 20}]

上述代碼中，首先使用sorted函數對字典列表按照’name’鍵進行排序，然後利用groupby函數分組，最後取每組的第一個元素作為結果。

四、最優解決方案

上述方法中，自定義函數和利用標準庫的方法都存在一些問題，要麼運行效率低要麼降低了代碼的可讀性。我們可以使用Python中的高級特性：列表推導式和集合推導式，來實現優化的去重操作：


lst = [{'name': 'Tom', 'age': 20}, {'name': 'Jerry', 'age': 22}, {'name': 'Tom', 'age': 20}]
key_func = lambda x: x['name']
new_lst = sorted(lst, key=key_func)
new_lst = [next(v) for _, v in itertools.groupby(new_lst, key=key_func)]

print(new_lst)  # 輸出：[{'name': 'Jerry', 'age': 22}, {'name': 'Tom', 'age': 20}]

上述代碼通過利用sorted函數對列表進行排序，然後結合groupby函數和列表推導式，進行了高效的去重操作，且便於理解和維護。我們可以將key_func換成其他鍵名，來進行不同鍵的去重操作。

總結

通過以上的介紹，可以看到Python針對字典列表去重提供了多種解決方案。我們可以根據不同的需求和場景，採用不同的方法來實現去重操作。如果有大量數據需要處理，建議使用第四種最優解決方案，以提高運行效率。

原創文章，作者：RDVRZ，如若轉載，請註明出處：https://www.506064.com/zh-hant/n/375034.html

Python字典列表去重

一、基本操作

二、自定義函數

三、利用Python標準庫

四、最優解決方案

總結

相關推薦

發表回復