一、破解原理
其實原理很簡單,一句話概括就是「大力出奇蹟」,Python 有兩個壓縮文件庫:zipfile 和 rarfile,這兩個庫提供的解壓縮方法 extractall()可以指定密碼,這樣的話首先生成一個密碼字典(手動或用程序),然後依次嘗試其中的密碼,如果能夠正常解壓縮表示密碼正確。
二、實驗環境
本文採取的虛擬環境為 Pipenv.
庫
- zipfile:Python 標準庫,使用時直接導入即可
- rarfile:Python 第三方庫
利用 Pipenv 安裝 rarfile
pipenv install rarfile最後,再將一個帶有密碼的壓縮包放入實驗環境中即可。
三、編碼
知道原理後,編碼就會非常簡單了
準備密碼本
「密碼本」其實就是一個包含了所有可能密碼的文件,用戶可以手動錄入,也可以用程序錄入。文末還會有一個介紹。
讀取壓縮文件
# 根據文件擴展名,使用不同的庫
if filename.endswith('.zip'):
fp = zipfile.ZipFile(filename)
elif filename.endswith('.rar'):
fp = rarfile.RarFile(filename)
嘗試解壓
先嘗試不用密碼解壓縮,如果成功則表示壓縮文件沒有密碼
fp.extractall(desPath)
fp.close()
print('No password')
return暴力破解
try:
# 讀取密碼本文件
fpPwd = open('pwd.txt')
except:
print('No dict file pwd.txt in current directory.')
return
for pwd in fpPwd:
pwd = pwd.rstrip()
try:
fp.extractall(path=desPath, pwd=pwd.encode())
print('Success! ====>'+pwd)
fp.close()
break
except:
pass
fpPwd.close()
程序入口
if __name__ == '__main__':
filename = sys.argv[1]
if os.path.isfile(filename) and filename.endswith(('.zip', '.rar')):
decryptRarZipFile(filename)
else:
print('Must be Rar or Zip file')
四、使用
如果想要使用上述代碼,我們只需在命令行執行python main.py <filename>即可。例如python main.py test.zip
運行結果:
$ python main.py test.zip
Success! ====>323126
五、擴展
密碼本如何獲取?
如何加速破解過程?
解決了密碼本的問題,深入思考的小夥伴的一定又會有新的疑問,密碼本既然如此龐大,那如何加速破解的過程呢?這裡給出兩個思路
多線程(進程)破解
密碼本如果很多且密碼數量龐大時,我們可以採用多線程(進程)的方式讀取密碼,一個進程讀一個密碼本,一個線程分段讀密碼。當然,如果是在 python 中,建議不要採用多線程,因為 python 中的線程就是雞肋,有興趣的可以閱讀相關資料。
import zipfile
import itertools
from concurrent.futures import ThreadPoolExecutor
def extract(file, password):
if not flag: return
file.extractall(path='.', pwd=''.join(password).encode('utf-8'))
def result(f):
exception = f.exception()
if not exception:
# 如果獲取不到異常說明破解成功
print('密碼為:', f.pwd)
global flag
flag = False
if __name__ == '__main__':
# 創建一個標誌用於判斷密碼是否破解成功
flag = True
# 創建一個線程池
pool = ThreadPoolExecutor(100)
nums = [str(i) for i in range(10)]
chrs = [chr(i) for i in range(65, 91)]
# 生成數字+字母的6位數密碼
password_lst = itertools.permutations(nums + chrs, 6)
# 創建文件句柄
zfile = zipfile.ZipFile("加密文件.zip", 'r')
for pwd in password_lst:
if not flag: break
f = pool.submit(extract, zfile, pwd)
f.pwd = pwd
f.pool = pool
f.add_done_callback(result)
這個代碼有個問題,跑一會兒內存就爆了!原因:ThreadPoolExecutor默認使用的是無界隊列,嘗試密碼的速度跟不上生產密碼的速度,會把生產任務無限添加到隊列中。導致內存被佔滿。內存直接飆到95:

然後程序奔潰:

import queue
from concurrent.futures import ThreadPoolExecutor
class BoundedThreadPoolExecutor(ThreadPoolExecutor):
def __init__(self, max_workers=None, thread_name_prefix=''):
super().__init__(max_workers, thread_name_prefix)
self._work_queue = queue.Queue(self._max_workers * 2) # 設置隊列大小利用 GPU 加速
我們以上的代碼都是運行在 CPU 上的,即使開啟多線程(進程)也只是利用到 CPU 的資源,但如果想要加速破解過程,我們其實還可以利用閑置的 GPU 資源。
在介紹為什麼可以利用 GPU 加速前,我們需要明確一個觀點,兩者都為了完成計算任務而設計。
那為什麼會想到使用 GPU 加速呢?這是就要說到兩者的不同了:CPU 雖然有多核,但總數沒有超過兩位數,並且每個核的運算能力極其強大。而 GPU 的核數遠超 CPU,但每個核的運算能力與 CPU 的核相比就相差甚遠了。
我們可以簡單的舉個例子,解一道題,CPU 就是博士生,GPU 就是小學生,CPU 負責理解題目並且整理出解題的步驟以及解法,而 GPU 負責其中很簡單但是數量又很大的簡單運算就行了。
因此理論上在破解密碼的過程中,我們完全可以使用 GPU 來加速這一過程。
事實上,這樣的工具也已經出現了,Hashcat 便是最出名的一個,它號稱是世界上最快的密碼恢復工具,可以基於 CPU/GPU 等工作。
算就行了。
因此理論上在破解密碼的過程中,我們完全可以使用 GPU 來加速這一過程。
事實上,這樣的工具也已經出現了,Hashcat 便是最出名的一個,它號稱是世界上最快的密碼恢復工具,可以基於 CPU/GPU 等工作。
原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/276498.html
微信掃一掃
支付寶掃一掃