本文目錄一覽:
怎麼樣python爬蟲進行此網站爬取
是加密的,解密方法在JS裡面可以弄出來。
首先要AES解密,可以【Python:import Crypto.Cipher.AES】包,解密mode是CFB,seed是”userId:”+uid+”:seed”的SHA256值,解密的key是seed[0:24],iv是seed[len(seed)-16:]。
如果沒有登錄,uid就是用的”anyone”,這時候的seed是”61581AF471B166682A37EFE6DD40FE4700EE337FEEEF65E2C8F203FCA312AAAB”,也就是key為”61581AF471B166682A37EFE6″,iv為”C8F203FCA312AAAB”。
解密後文件是壓縮過的,解壓即可得到一個JSON。這部分解壓我沒仔細看他的算法,好像是gzip,直接用【Python:import gzip】解壓有點出錯,可能沒用對或者不是這個算法,你在研究一下。第二種投機的方法就是,可以通過【Python:import execjs】直接調用他的pako.js文件的JS的inflate()函數來解壓這塊。JS代碼混淆後看起來是非常難懂的,使用這種做法可以不用太看懂加密的算法,效率當然寫Python實現這個解密算法低1點咯。
最後的JSON再用【Python:import demjson】解析,text的value就是文檔。
Python實現批量壓縮文件/文件夾——zipfile
zipfile是python里用來做zip格式編碼的壓縮和解壓縮的,由於是很常見的zip格式,所以這個模塊使用頻率也是比較高的,
在這裡對zipfile的使用方法做一些記錄。即方便自己也方便別人。
Python zipfile模塊用來做zip格式編碼的壓縮和解壓縮的,要進行相關操作,首先需要實例化一個 ZipFile 對象。ZipFile 接受一個字符串格式壓縮包名稱作為它的必選參數,第二個參數為可選參數,表示打開模式,類似於文件操作,有r/w/a三種模式,分別代表讀、寫、添加,默認為r,即讀模式。
zipfile里有兩個非常重要的class, 分別是ZipFile和ZipInfo, 在絕大多數的情況下,我們只需要使用這兩個class就可以了。ZipFile是主要的類,用來創建和讀取zip文件而ZipInfo是存儲的zip文件的每個文件的信息的。
ZipFile還提供了如下常用的方法和屬性:
獲取zip文檔內指定文件的信息。返回一個zipfile.ZipInfo對象,它包括文件的詳細信息。
獲取zip文檔內所有文件的信息,返回一個zipfile.ZipInfo的列表。
獲取zip文檔內所有文件的名稱列表。
將zip文檔內的指定文件解壓到當前目錄。參數member指定要解壓的文件名稱或對應的ZipInfo對象;參數path指定了解析文件保存的文件夾;
解壓zip文檔中的所有文件到當前目錄。參數members的默認值為zip文檔內的所有文件名稱列表,也可以自己設置,選擇要解壓的文件名稱。
將zip文檔內的信息打印到控制台上。
設置zip文檔的密碼。
python或JS對SQL語句美化和壓縮
python或JS對SQL語句美化和壓縮
a = 123sql = ‘select * from table’ if not a else ‘select * from table where a={}’.format(a)
python怎樣壓縮和解壓縮ZIP文件
指令如下:
import zipfile
zip_ref = zipfile.ZipFile(path_to_zip_file, ‘r’)
zip_ref.extractall(directory_to_extract_to)
zip_ref.close()
其中zipfile是python自帶的一個工具包,用來解壓縮的,應該不需要安裝就有。
原創文章,作者:W370T,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/128595.html