一、任務調度器簡介
在進行代碼優化之前,我們需要了解Python的任務調度器,它是Python提供的一種多任務管理方式,允許多個任務並發執行,以便實現高效利用CPU。Python的任務調度器主要分為兩種,一種是Thread,另一種是Process。
Thread是一個輕量級的進程,它只能運行在同一個進程之間,因為Python有一個全局解釋器鎖(GIL),而這個鎖只允許一個線程在Python解釋器中運行。因此,當我們使用Thread時,我們的代碼並不會得到多線程的優勢,反而會降低整體的執行效率。
Process則是完全獨立的進程,它們可以並發執行,讓CPU平衡地處理多個任務。但是Process開銷比Thread大,且不同進程之間不能直接共享數據,需要使用一些IPC工具進行通信。
因此,為了能夠同時發揮Python多任務的優勢又不受GIL的限制,我們可以從Python3.7版本開始使用asyncio庫,它提供了基於協程的任務調度方式。asyncio庫是Python自帶的一個異步IO庫,它專門解決了IO密集型的任務處理場景,支持並發執行,通過task.run()實現高效地使用協程。
二、使用task.run()實現高效代碼執行
對於Python3.7及以上版本的用戶,我們可以使用asyncio庫和task.run()來實現高效的代碼執行,下面是一個簡單的示例:
import asyncio async def task(): print("start") await asyncio.sleep(2) print("end") async def main(): task_list = [task(), task(), task()] await asyncio.gather(*task_list) if __name__ == "__main__": asyncio.run(main())
在上面的代碼示例中,我們定義了一個協程(即任務)task(),它會等待2秒鐘然後輸出”end”,然後我們定義了一個主協程main(),它會同時啟動3個task()協程,等待它們全部完成之後才結束。
使用asyncio庫和task.run()可以充分利用CPU進行並發處理,因為我們的任務是IO密集型的,也就是CPU不需要做很多運算,而是等待IO操作完成,因此可以用asyncio使用異步IO,在等待IO操作的同時進行其他任務處理,提高了整個程序的效率。
三、使用並發技巧優化代碼執行效率
除了使用asyncio庫和task.run()外,我們還可以通過一些並發技巧來進一步優化代碼的執行效率,下面我們將分別介紹使用多進程、多線程和協程來實現並發。
1. 使用多進程並發
import concurrent.futures def task(num): print("start_{}".format(num)) time.sleep(2) print("end_{}".format(num)) if __name__ == "__main__": with concurrent.futures.ProcessPoolExecutor() as executor: count = 3 executor.map(task, [i for i in range(count)])
在上面的代碼示例中,我們使用了concurrent.futures庫和ProcessPoolExecutor()來實現多進程並發,使用map()方法啟動多個task()進程同時執行。
多進程並發可以充分利用CPU多核處理器的特性,同時運行多個進程,每個進程相互獨立,且不受GIL的限制,可以先進先出(FIFO)地進入處理隊列,加快了處理速度和效率。
2. 使用多線程並發
import concurrent.futures def task(num): print("start_{}".format(num)) time.sleep(2) print("end_{}".format(num)) if __name__ == "__main__": with concurrent.futures.ThreadPoolExecutor() as executor: count =3 executor.map(task, [i for i in range(count)])
在上面的代碼示例中,我們使用了concurrent.futures庫和ThreadPoolExecutor()來實現多線程並發,使用map()方法啟動多個task()線程同時執行。
多線程並發可以有效地利用CPU處理器的能力,同時運行多個線程,由於線程之間共享全局變量,也受GIL的限制,容易產生資源競爭的問題。因此,我們需要注意線程安全問題。
3. 使用協程並發
import asyncio async def task(num): print("start_{}".format(num)) await asyncio.sleep(2) print("end_{}".format(num)) async def main(): task_list = [task(i) for i in range(3)] await asyncio.gather(*task_list) if __name__ == "__main__": asyncio.run(main())
在上面的代碼示例中,我們使用了asyncio庫和task()協程來實現多協程並發,使用gather()方法啟動多個task()協程同時執行。
協程並發通過異步非阻塞的方式實現,即通過一種特殊的函數和關鍵字,讓不同任務交錯執行、同時進行,提高資源利用率和運行效率。相比於多進程、多線程,協程的開銷更小、更容易掌控,也能很好地克服I/O密集型任務而導致的CPU阻塞問題。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/305201.html