本文目錄一覽:
- 1、Python爬蟲(七)數據處理方法之JSON
- 2、python中如何遍歷json數組
- 3、【Python】淺談python中的json
- 4、py3筆記8:json結構的校驗
- 5、python 怎麼處理json
Python爬蟲(七)數據處理方法之JSON
JSON 指的是 JavaScript 對象表示法(JavaScript Object Notation),是輕量級的文本數據交換格式,且具有自我描述性,更易理解。
JSON看起來像python類型(列表,字典)的字元串。
在之前的文章中,我們說到了怎麼用response的方法,獲取到網頁正確解碼後的字元串。如果還有不懂的,可以先閱讀 Python爬蟲(三)Requests庫 。接下來以有道翻譯為例子,說說怎麼通過網頁解碼後的字元串,提取到翻譯結果。
再結合上述有道翻譯的例子,得到字典類型的返回結果,並提取出來翻譯結果。
將上述例子的dict_json換成str字元串,再寫入文本中。
執行完上述的程序,會得到一個fanyi.txt的文件,其結果如下:{“type”: “ZH_CN2EN”, “errorCode”: 0, “elapsedTime”: 1, “translateResult”: [[{“src”: “\u4eba\u751f\u82e6\u77ed\uff0c\u6211\u7528python”, “tgt”: “Life is too short, I use python”}]]}。這樣子的一份文檔,中文部分顯示的是二進位,且格式非常不利於閱讀,這並不是我們想要的結果。好在json.dumps()為我們提供的兩個方法,以幫助我們更好閱讀文檔。
1.ensure_ascii,能夠讓中文顯示成中文;
2.indent,能夠讓下一行在第一行的基礎上空格。
其用法如下:
python中如何遍歷json數組
1、創建python文件,testjson.py;
2、編寫python代碼,解析json數組,
json_str = {“name”:”lisi”,
“age”:27}
for key, value in json_str.items():
print(str(key) + ‘=’ + str(value))
3、右擊,選擇『在終端中運行Python文件』;
4、查看運行結果,即可發現解析完成;
【Python】淺談python中的json
一 前言
最近一直在做開發相關的工作–基於Django的web 平台,其中需要從model層傳輸數據到view 層做數據展示或者做業務邏輯處理。我們採用通用的Json格式–Json(JavaScript Object Notation) 是一種輕量級的數據交換格式,易於閱讀和程序解析。
二 認識Json
2.1 Json 結構
常見的Json格式為 「名稱/值」對的集合,其中 值可以是對象,列表,字典,字元串等等。比如
backup_data = {“back_to_host”: “dbbk0”,
“ip_address”: “10.10.20.3”,
“host_name”: “rac4”,
“port”: 3306}
2.2 使用Json
Python的Json模塊序列化與反序列化的過程分別是 編碼和解碼。這兩個過程涉及到兩組不同的函數
編碼 把一個Python對象編碼轉換成Json字元串,json.dumps(data)/json.dump(data,file_handler)
解碼 把Json格式字元串解碼轉換成Python對象,json.loads(data)/json.load(file_handler)
在python中要使用Json模塊做相關操作,必須先導入:
import Json
2.3 主要函數
編碼函數主要有 json.dumps(data)/json.dump(data,file_handler)
json.dumps()的參數是將python對象轉換為字元串,如使用json.dumps序列化的對象json_dumps=json.dumps({‘a’:1, ‘b’:2}) ,json_dumps='{“b”: 2, “a”: 1}’
json.dump 是將內置類型序列化為json對象後寫入文件。
解碼函數主要由json.loads(data)/json.load(file_handler)
json.loads的參數是內存對象,把Json格式字元串解碼轉換成Python對象,json_loads=json.loads(d_json) #{ b”: 2, “a”: 1},使用load重新反序列化為dict
json.load()的參數針對文件句柄,比如本地有一個文件/tmp/test.json json_load=json.load(open(‘/tmp/test.json’))
具體案例參考如下:
In [3]: data={“back_to_host”: “rac1”,
…: “ip_address”: “10.215.20.3”,
…: “host_name”: “rac3”,
…: “port”: 3306}
In [7]: json_str=json.dumps(data)
In [8]: print json_str
{“ip_address”: “10.215.20.3”, “back_to_host”: “rac1”, “host_name”: “rac3”, “port”: 3306}
In [9]: json_loads=json.load(json_str)
—————————————————————————
AttributeError Traceback (most recent call last)
ipython-input-9-180506f16431 in module()
—- 1 json_loads=json.load(json_str)
/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/json/__init__.pyc in load(fp, encoding, cls, object_hook, parse_float, parse_int, parse_constant, object_pairs_hook, **kw)
284
285 “”
注意 從上面的報錯信息來看 json.loads 傳參是字元串類型,並不是文件句柄,沒有 read()屬性。
In [10]: json_loads=json.loads(json_str)
In [11]: print json_loads
{u’back_to_host’: u’rac1′, u’ip_address’: u’10.215.20.3′, u’host_name’: u’rac3′, u’port’: 3306}
In [12]: type(json_loads)
Out[12]: dict
In [13]: type(json_str)
Out[13]: str
利用dump 將數據寫入 dump.json
In [17]: with open(‘/tmp/dump.json’,’w’) as f:
…: json.dump(json_str,f)
…:
yangyiDBA:~ yangyi$ cat /tmp/dump.json
“{\”ip_address\”: \”10.10.20.3\”, \”back_to_host\”: \”rac1\”, \”host_name\”: \”rac3\”, \”port\”: 3306}”
yangyiDBA:~ yangyi$
利用json.load 將dump.sjon的數據讀出來並賦值給 data
In [18]: with open(‘/tmp/dump.json’,’r’) as f:
…: data=json.load(f)
…:
In [19]: print data
{“ip_address”: “10.10.20.3”, “back_to_host”: “rac1”, “host_name”: “rac3”, “port”: 3306}
三 小結
本文算是一篇學習筆記,主要對比了json.loads/json.load , json.dumps/ json.dump 的使用差異 ,方便以後更好的使用json 。
以上為本次分享內容,感謝觀看。
py3筆記8:json結構的校驗
python中使用json模塊實現python對象與json的轉換
要處理的是文件而不是字元串,你可以使用 json.dump() 和 json.load() 來編碼和解碼JSON數據
Json Schema 是一個用於驗證Json數據結構的強大工具
使用範圍: 介面測試中數據值校驗、數據類型校驗、json數據結構校驗
官網:
安裝: pip install jsonschema
type 關鍵字是json模式的基礎,指定架構的數據類型:string、number、object、array、boolean、null
object關鍵字,在python中對應的是dict類型
數組屬性array,用於有序元素
在python中,array類似於list或tuple
在Json,通常有2種方式驗證
1. 列表驗證: 任意長度的序列,其中每個元素匹配相同的模式
2. 元組驗證: 一個固定長度的序列,其中每個項目可能具有不同的模式
1. 列表驗證
2. 元組驗證
針對每一個元素解釋說明,默認校驗schema中設置的前n項
將items關鍵字設置成一個數組, 其中每個項目都是一個與文檔數組的每個索引相對應的模式,
也就是一個數組, 第一個元素模式驗證輸入數組的第一個元素. 第二個元素模式驗證輸入數組的第二個元素
例如, 在以下的模式, anyOf關鍵字用於表示給定值可能對任何給定的子模式有效。第一個子模式需要一個最大長度為5的字元串。第二個子模式需要一個最小值為0的數字。只要一個值對這些模式中的任何一個進行驗證,它就被認為整個組合模式有效。
{ 『anyOf』: [ {『type』: 『string』, 『maxLength』: 5}, {『type』:』string』, 『minimum』: 0 }]}
用於組合模式的關鍵字是:
該$schema關鍵字用於聲明JSON片段實際上是JSON模式的一部分。它還聲明了針對該模式編寫的JSON Schema標準的哪個版本。
建議所有JSON模式都有一個$schema條目,該條目必須位於根目錄下。因此,大多數情況下,您需要在架構的根目錄下:
python 怎麼處理json
json.dumps()
該函數可以將簡單數據類型(int\float\string\tuple\list\dict\unicode)轉換成JSON格式,樣例代碼如下:
import json
src_data = {“name”:”Tacey”,”age”:13,”sex”:”male”,”interst”:(“Programing”,”Reading”)}
#print repr(src_data)
print json.dumps(src_data)
輸出如下:
{‘interst’:(‘Programing’,’Reading’),’age’:23,’name’:’Tacey’,’sex’:’male’}
{“interst”:[“programing”,”Reading”],”age”:23,”name”:”Tacey”,”sex”:mal”}
2、json.loads()
該函數可以將JSON數據轉換成Python的簡單數據類型,接著上面的代碼:
json_data = json.dumps(src_data)
print json.loads(json_data)[“name”]
輸出結果:
Tacey
原創文章,作者:NLFY,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/145705.html