本文目錄一覽:
Python爬蟲(七)數據處理方法之JSON
JSON 指的是 JavaScript 對象表示法(JavaScript Object Notation),是輕量級的文本數據交換格式,且具有自我描述性,更易理解。
JSON看起來像python類型(列表,字典)的字元串。
在之前的文章中,我們說到了怎麼用response的方法,獲取到網頁正確解碼後的字元串。如果還有不懂的,可以先閱讀 Python爬蟲(三)Requests庫 。接下來以有道翻譯為例子,說說怎麼通過網頁解碼後的字元串,提取到翻譯結果。
再結合上述有道翻譯的例子,得到字典類型的返回結果,並提取出來翻譯結果。
將上述例子的dict_json換成str字元串,再寫入文本中。
執行完上述的程序,會得到一個fanyi.txt的文件,其結果如下:{“type”: “ZH_CN2EN”, “errorCode”: 0, “elapsedTime”: 1, “translateResult”: [[{“src”: “\u4eba\u751f\u82e6\u77ed\uff0c\u6211\u7528python”, “tgt”: “Life is too short, I use python”}]]}。這樣子的一份文檔,中文部分顯示的是二進位,且格式非常不利於閱讀,這並不是我們想要的結果。好在json.dumps()為我們提供的兩個方法,以幫助我們更好閱讀文檔。
1.ensure_ascii,能夠讓中文顯示成中文;
2.indent,能夠讓下一行在第一行的基礎上空格。
其用法如下:
如何用Python,查找json格式中指定的數據,然後輸出這些查找到的數據?
用Python查找json格式中指定的數據輸出這些查找到的數據的操作步驟如下:
1,打開一個編輯器,例如sublime text 3,然後創建一個新的PY文檔。
2,導入os因為要傳輸文件,所以我們必須引入os庫,以便您可以找到文件。
3,用打開(「 E:\\ test.txt」)作為文件:print(file.readlines())在這裡讀取文件,可以看到每一行都以列表的形式存儲。
4,r l行:l = l.strip(「 \ n」)print(l)在這裡,我們使用strip刪除換行符。
5,string = l.split(「 =」)接下來,我們使用split將字元串拆分為一個列表。
6,創建一個空字典。結果[string [0]] = string [1]現在將每行的鍵和值導入字典。
如何用python處理json文件
import json,time
infos = {“_id”:”description”,”name”:”python”,”filename”:”中文”,”os”:[“abcd”,”hello”,”www”]}
infos[“time”] = time.time()#動態修改json文件內容
#生成json文件
def json_file(infos):
with open(“./static/desc.desc”,”w”) as jsonf:
jsonf.write(json.dumps(infos))
json_file(infos)
#讀取json文件的內容
file_info = json.load(file(“./static/desc.desc”))
print file_info,type(file_info)
filename = file_info[“filename”]
print filename
infos = json.dumps(file_info,sort_keys=True,indent=4)
print infos,type(infos)
python使用json模塊來處理json數據
原創文章,作者:FJV1J,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/127904.html