本文目录一览:
Python爬虫(七)数据处理方法之JSON
JSON 指的是 JavaScript 对象表示法(JavaScript Object Notation),是轻量级的文本数据交换格式,且具有自我描述性,更易理解。
JSON看起来像python类型(列表,字典)的字符串。
在之前的文章中,我们说到了怎么用response的方法,获取到网页正确解码后的字符串。如果还有不懂的,可以先阅读 Python爬虫(三)Requests库 。接下来以有道翻译为例子,说说怎么通过网页解码后的字符串,提取到翻译结果。
再结合上述有道翻译的例子,得到字典类型的返回结果,并提取出来翻译结果。
将上述例子的dict_json换成str字符串,再写入文本中。
执行完上述的程序,会得到一个fanyi.txt的文件,其结果如下:{“type”: “ZH_CN2EN”, “errorCode”: 0, “elapsedTime”: 1, “translateResult”: [[{“src”: “\u4eba\u751f\u82e6\u77ed\uff0c\u6211\u7528python”, “tgt”: “Life is too short, I use python”}]]}。这样子的一份文档,中文部分显示的是二进制,且格式非常不利于阅读,这并不是我们想要的结果。好在json.dumps()为我们提供的两个方法,以帮助我们更好阅读文档。
1.ensure_ascii,能够让中文显示成中文;
2.indent,能够让下一行在第一行的基础上空格。
其用法如下:
如何用Python,查找json格式中指定的数据,然后输出这些查找到的数据?
用Python查找json格式中指定的数据输出这些查找到的数据的操作步骤如下:
1,打开一个编辑器,例如sublime text 3,然后创建一个新的PY文档。
2,导入os因为要传输文件,所以我们必须引入os库,以便您可以找到文件。
3,用打开(“ E:\\ test.txt”)作为文件:print(file.readlines())在这里读取文件,可以看到每一行都以列表的形式存储。
4,r l行:l = l.strip(“ \ n”)print(l)在这里,我们使用strip删除换行符。
5,string = l.split(“ =”)接下来,我们使用split将字符串拆分为一个列表。
6,创建一个空字典。结果[string [0]] = string [1]现在将每行的键和值导入字典。
如何用python处理json文件
import json,time
infos = {“_id”:”description”,”name”:”python”,”filename”:”中文”,”os”:[“abcd”,”hello”,”www”]}
infos[“time”] = time.time()#动态修改json文件内容
#生成json文件
def json_file(infos):
with open(“./static/desc.desc”,”w”) as jsonf:
jsonf.write(json.dumps(infos))
json_file(infos)
#读取json文件的内容
file_info = json.load(file(“./static/desc.desc”))
print file_info,type(file_info)
filename = file_info[“filename”]
print filename
infos = json.dumps(file_info,sort_keys=True,indent=4)
print infos,type(infos)
python使用json模块来处理json数据
原创文章,作者:FJV1J,如若转载,请注明出处:https://www.506064.com/n/127904.html