使用Python創建並管理線程

一、Python線程基礎

在Python中，一個進程可以創建多個線程來執行不同的任務。線程與進程不同，線程是操作系統能夠調度的最小單位，一個進程可以包含多個線程，這些線程會共享該進程的內存。

Python中線程的創建非常方便，只需導入多線程模塊(threading)，並創建Thread實例。

import threading

def worker():
    print('I am a worker')
    
t = threading.Thread(target=worker)
t.start()

上述代碼創建了一個線程，並將其target設為worker函數。在調用start方法時，會啟動一個新線程，並開始執行worker函數。

二、線程同步

多個線程執行時，如果沒有足夠的同步機制，容易導致資源競爭現象，如數據不一致，死鎖等錯誤。Python提供了多種同步機制，最常用的是鎖。

import threading

count = 0

def worker(lock):
    global count
    for i in range(100000):
        lock.acquire()  # 獲取鎖
        count += 1
        lock.release()  # 釋放鎖
        
lock = threading.Lock()

t1 = threading.Thread(target=worker, args=(lock,))
t2 = threading.Thread(target=worker, args=(lock,))

t1.start()
t2.start()

t1.join()
t2.join()

print(count)

上述代碼定義了一個計數器count，為了保證count的安全性，我們使用了鎖機制。在worker函數中，對count進行加一操作前先獲取鎖，加完一後再釋放鎖。當多個線程同時執行該代碼時，只有一個線程能夠獲得鎖並執行，其餘線程則等待該鎖的釋放。

三、線程池

線程池是一種優化的線程調度方式，由很多實現函數和復用線程的線程容器構成。Python的線程池可以通過ThreadPoolExecutor來實現。

from concurrent.futures import ThreadPoolExecutor

def worker(num):
    print('Thread %s started' % num)
    return

with ThreadPoolExecutor(max_workers=3) as executor:
    for i in range(6):
        executor.submit(worker, i+1)

上述代碼創建了一個包含3個線程的線程池，然後以6個任務的方式提交worker函數。線程池的max_workers設置了3個線程，所以只有3個線程會同時被調度執行，其他任務需要等待空閑線程出現。

四、多進程和多線程的比較

多進程和多線程都可以並發執行多個任務，但是它們有著不同的優勢和限制。

多進程通常用於計算密集型任務，例如圖像處理和音視頻編碼等。它們可以利用計算機的多核心CPU，並且由於進程之間的內存空間互相獨立，相對較為穩定，可以有效地避免內存泄漏和數據共享的競爭問題。

多線程通常用於I/O密集型任務，例如網路通訊和文件讀寫等。由於I/O操作通常比CPU計算操作更慢，同時又有大量的阻塞時間，因此可以利用多線程來提高CPU和I/O設備的利用率，從而獲得更好的性能。但是由於線程之間共享內存，需要更加小心地處理線程同步，否則可能引起死鎖、競爭和數據一致性的問題。

五、總結

Python提供了方便的多線程支持，並且在處理大量的I/O任務時，多線程的性能往往是更好的選擇。但是在處理高並發且計算密集型的任務時，則需要考慮使用多進程來獲得更好的性能和穩定性。

在進行多線程編程時，需要注意線程同步和數據一致性問題，可以使用鎖等同步機制來解決競爭問題。同時，線程池也是一種優化的線程調度方式，可以有效地管理線程的數量和復用性，提高整體的執行效率。

原創文章，作者：AOTN，如若轉載，請註明出處：https://www.506064.com/zh-tw/n/133727.html