如何編寫去重計數函數

一、什麼是去重計數函數

去重計數函數旨在從一堆數據中篩選出不同的值並計算其出現次數。例如,我們有一個包含重複元素的列表[1,2,1,3,2,4,1,3,5,6],去重後剩下[1,2,3,4,5,6],並且他們出現的次數分別為[3,2,2,1,1,1]。

在實際應用中,去重計數函數有很多用途,例如:日誌分析、用戶統計、網絡爬蟲等等。

二、如何實現去重計數函數

1. 使用set集合

set集合是一種不允許重複元素的容器。我們可以使用set集合先對數據進行去重,再遍歷set集合計算每個元素出現的次數。


def count_unique_num_using_set(nums):
    unique_nums = set(nums)
    for num in unique_nums:
        print("num:", num, "count:", nums.count(num))
    return len(unique_nums)

2. 使用字典計數

針對上述方法的缺陷,我們可以使用字典來記錄每個元素的出現次數,而無需遍歷整個列表,從而提高效率。


def count_unique_num_using_dict(nums):
    dict_num_count = {}
    for num in nums:
        dict_num_count[num] = dict_num_count.get(num, 0) + 1
    for num, count in dict_num_count.items():
        print("num:", num, "count:", count)
    return len(dict_num_count)

3. 使用Counter計數器

Python的collections模塊提供了一個Counter計數器,它用專門的字典來跟蹤值的出現次數。


from collections import Counter

def count_unique_num_using_counter(nums):
    cnt = Counter(nums)
    for num, count in cnt.items():
        print("num:", num, "count:", count)
    return len(cnt)

三、去重計數函數的應用案例

1. 統計一段文字中出現次數最多的單詞

可以通過去重計數函數和split()方法將一段文字劃分為單詞,並使用字典或Counter計數器統計每個單詞的出現次數。


text = "Hello world, I am a Python programmer. I love Python and I think Python is the best programming language."
words = text.split()
word_count = Counter(words)
print(word_count.most_common(1))

2. 統計網頁中每個URL的出現次數

網絡爬蟲經常需要統計數據,可以通過去重計數函數和正則表達式快速地統計一個網頁中每個URL的出現次數。


import re
import requests
from collections import Counter

url = "https://www.python.org"
response = requests.get(url)
content = response.text
urls = re.findall(r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+', content)
url_count = Counter(urls)
for url, count in url_count.items():
    print("url:", url, "count:", count)

3. 日誌分析

可以通過去重計數函數和正則表達式統計日誌中每個IP的出現次數。


import re
import requests
from collections import Counter

log_file_path = "log.txt"
with open(log_file_path, "r") as f:
    content = f.read()
ip_pattern = r"\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}"
ips = re.findall(ip_pattern, content)
ip_count = Counter(ips)
for ip, count in ip_count.items():
    print("ip:", ip, "count:", count)

四、總結

綜上所述,去重計數函數對於各種場景都是必備功能,並且有多種實現方式,可以根據實際情況選擇合適的方法。同時,我們還通過應用案例更好地理解並應用了去重計數函數。

原創文章,作者:RMJGU,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/368307.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
RMJGU的頭像RMJGU
上一篇 2025-04-12 01:13
下一篇 2025-04-12 01:13

相關推薦

  • Python中引入上一級目錄中函數

    Python中經常需要調用其他文件夾中的模塊或函數,其中一個常見的操作是引入上一級目錄中的函數。在此,我們將從多個角度詳細解釋如何在Python中引入上一級目錄的函數。 一、加入環…

    編程 2025-04-29
  • Python中capitalize函數的使用

    在Python的字符串操作中,capitalize函數常常被用到,這個函數可以使字符串中的第一個單詞首字母大寫,其餘字母小寫。在本文中,我們將從以下幾個方面對capitalize函…

    編程 2025-04-29
  • Python中set函數的作用

    Python中set函數是一個有用的數據類型,可以被用於許多編程場景中。在這篇文章中,我們將學習Python中set函數的多個方面,從而深入了解這個函數在Python中的用途。 一…

    編程 2025-04-29
  • 單片機打印函數

    單片機打印是指通過串口或並口將一些數據打印到終端設備上。在單片機應用中,打印非常重要。正確的打印數據可以讓我們知道單片機運行的狀態,方便我們進行調試;錯誤的打印數據可以幫助我們快速…

    編程 2025-04-29
  • 三角函數用英語怎麼說

    三角函數,即三角比函數,是指在一個銳角三角形中某一角的對邊、鄰邊之比。在數學中,三角函數包括正弦、餘弦、正切等,它們在數學、物理、工程和計算機等領域都得到了廣泛的應用。 一、正弦函…

    編程 2025-04-29
  • Python3定義函數參數類型

    Python是一門動態類型語言,不需要在定義變量時顯示的指定變量類型,但是Python3中提供了函數參數類型的聲明功能,在函數定義時明確定義參數類型。在函數的形參後面加上冒號(:)…

    編程 2025-04-29
  • Python定義函數判斷奇偶數

    本文將從多個方面詳細闡述Python定義函數判斷奇偶數的方法,並提供完整的代碼示例。 一、初步了解Python函數 在介紹Python如何定義函數判斷奇偶數之前,我們先來了解一下P…

    編程 2025-04-29
  • Python實現計算階乘的函數

    本文將介紹如何使用Python定義函數fact(n),計算n的階乘。 一、什麼是階乘 階乘指從1乘到指定數之間所有整數的乘積。如:5! = 5 * 4 * 3 * 2 * 1 = …

    編程 2025-04-29
  • Python函數名稱相同參數不同:多態

    Python是一門面向對象的編程語言,它強烈支持多態性 一、什麼是多態多態是面向對象三大特性中的一種,它指的是:相同的函數名稱可以有不同的實現方式。也就是說,不同的對象調用同名方法…

    編程 2025-04-29
  • 分段函數Python

    本文將從以下幾個方面詳細闡述Python中的分段函數,包括函數基本定義、調用示例、圖像繪製、函數優化和應用實例。 一、函數基本定義 分段函數又稱為條件函數,指一條直線段或曲線段,由…

    編程 2025-04-29

發表回復

登錄後才能評論