本文目錄一覽:
- 1、常用的python庫有哪些
- 2、Python中除了matplotlib外還有哪些數據可視化的庫
- 3、python”高維數據”可視化用什麼庫
- 4、【Python】淺談python中的json
- 5、Python爬蟲(七)數據處理方法之JSON
常用的python庫有哪些
10個頂級且實用的python庫
1、Dash
Dash是比較新的軟件包,它是用純python構建數據可視化app的理想選擇,因此特別適合處理數據的任何人。Dash是Flask、Plotly.js和React.js的混合體。
2、Pygame
Pygame是SDL多媒體庫的python裝飾器,SDL是一個跨平台開發庫,旨在提供對以下內容的低級接口:音頻、鍵盤、鼠標、遊戲桿、基於OpenGL和Direct3D的圖形硬件。
Pygame具有高度的可移植性,幾乎可以在所有平台和操作系統上運行。儘管它具有完善的遊戲引擎,但您也可以使用此庫直接從python腳本播放MP3文件。
3、Pillow
Pillow專門用於處理圖像,您可以使用該庫創建縮略圖,在文件格式之間轉換、旋轉、應用濾鏡、顯示圖像等等。如果您需要對許多圖像執行批量操作,這是理想的選擇。
4、Colorama
Colorama允許你在終端使用顏色,非常適合python腳本,文檔簡短而有趣,可以在Colorama PyPi頁面上找到。
5、JmesPath
在python中使用JSON非常容易,因為JSON在python字典上的映射非常好。此外,python帶有自己出色的json庫,用於解析和創建JSON。對我來說,這是它最好的功能之一,如果我需要使用JSON,可以考慮使用python。
JmesPath使python處理JSON更加容易,它允許您明確地指定如何從JSON文檔中提取元素。
6、Requests
Requests建立在世界上下載量最大的python庫urllib3上,它令Web請求變得非常簡單,功能強大且用途廣泛。
Requests可以完成您能想到的所有高級工作,比如:認證,使用cookie,執行POST、PUT、DELETE等,使用自定義證書,使用會話Session、使用代理等。
7、Simplejson
python中的本地json模塊有什麼問題?沒有!實際上,python的json是Simplejson。意思是:python採用了Simplejson的一個版本,並將其合併到每個發行版中,但是使用Simplejson具有一些優點:它適用於更多python版本、它比python隨附的版本更新頻率更高、它具有用C編寫的部分,因此非常快速。
8、Emoji
Emoji庫非常意思,但並非每個人都喜歡錶情包,分析視角媒體數據時,Emoji包非常有用。
9、Python-dateutil
Python-dateutil模塊提供了對標準datetime模塊的強大擴展。我的經驗是:常規的python日期時間功能在哪裡結束,而Python-dateutil就出現了。
10、BeautifulSoup
如果您從網站上提取了一些HTML,則需要對其進行解析以獲取實際所需的內容。BeautifulSoup是一個python庫,用於從HTML和XML文件中提取數據。它提供了導航,搜索和修改解析樹的簡單方法。它非常強大,即使損壞了,也能夠處理各種HTML,這是一個非常強大的功能。
它的一些主要功能:
①BeautifulSoup會自動將傳入文檔轉換為Unicode,將傳出文檔轉換為UTF-8,您無需考慮編碼。
②BeautifulSoup位於流行的python解析器的頂部,使您可以嘗試不同的解析策略或提高靈活性。
Python中除了matplotlib外還有哪些數據可視化的庫
數據可視化是展示數據、理解數據的有效手段,常用的Python數據可視化庫如下:
1.Matplotlib:第一個Python可視化庫,有許多別的程序庫都是建立在其基礎上或者直接調用該庫,可以很方便地得到數據的大致信息,功能非常強大,但也非常複雜。
2.Seaborn:利用Matplotlib,用簡潔的代碼來製作好看的圖表,與Matplotlib最大的區別為默認繪圖風格和色彩搭配都具有現代美感。
3.ggplot:基於R的一個作圖庫的ggplot2,同時利用了源於《圖像語法》中的概念,允許疊加不同的圖層來完成一幅圖,並不適用於製作非常個性化的圖像,為操作的簡潔度而犧牲了圖像的複雜度。
4.Bokeh:與ggplot很相似,但與ggplot不同之處為它完全基於Python而不是從R處引用。長處在於能用於製作可交互、可直接用於網絡的圖表。圖表可以輸出為JSON對象、HTML文檔或者可交互的網絡應用。
5.Plotly:可以通過Python notebook使用,與bokeh一樣致力於交互圖表的製作,但提供在別的庫中幾乎沒有的幾種圖表類型,如等值線圖、樹形圖和三維圖表。
6.pygal:與Bokeh和Plotly一樣,提供可直接嵌入網絡瀏覽器的可交互圖像。與其他兩者的主要區別在於可將圖表輸出為SVG格式,所有的圖表都被封裝成方法,且默認的風格也很漂亮,用幾行代碼就可以很容易地製作出漂亮的圖表。
7.geoplotlib:用於製作地圖和地理相關數據的工具箱。可用來製作多種地圖,比如等值區域圖、熱度圖、點密度圖等,必須安裝Pyglet方可使用。
8.missingno:用圖像的方式快速評估數據缺失的情況,可根據數據的完整度對數據進行排序或過濾,或者根據熱度圖或樹狀圖對數據進行修正。
python”高維數據”可視化用什麼庫
常見的Python可視化庫有哪些?
Matplotlib
Matplotlib是一個Python 2維繪圖庫,已經成為Python中公認的數據可視化工具,通過Matplotlib你可以很輕鬆地畫一些或簡單或複雜地圖形,幾行代碼即可生成線圖、直方圖、功率譜、條形圖、錯誤圖、散點圖等等。
Seaborn
Seaborn是基於Mtplotlib產生的一個模塊,專攻於統計可視化,可以和pandas進行無縫鏈接,使初學者更容易上手。相對於Matplotlib,Seaborn語法更簡潔,兩者關係類似於NumPy、和Pandas之間的關係。
HoloViews
HoloViews是一個開源的Python庫,可以用非常少的代碼行中完成數據分析和可視化,除了默認的Matplotlib後端外,還添加了一個Bokeh後端。Bokeh提供了一個強大的平台,通過結合Bokeh提供的交互式小部件,可以使用HTML5 canvas和WebGL快速生成交互性和高維可視化,非常適合於數據的交互式探索。
Altair
Altair是Python的一個公認的統計可視化庫,它的API簡單、友好、一致,並建立在強大的vega-lite(交互式圖形語法)之上。Altair API不包含實際的可視化呈現代碼,而是按照vega-lite規範發出JSON數據結構。由此產生的數據可以在用戶界面中呈現,這種優雅的簡單性產生了漂亮且有效的可視化效果,且只需很少的代碼。
ggplot
ggplot是基於R的ggplot2和圖形語法的Python的繪圖系統,實現了更少的代碼繪製更專業的圖形。
它使用一個高級且富有表現力的API來實現線,點等元素的添加,顏色的更改等不同類型的可視化組件的組合或添加,而不需要重複使用相同的代碼,然而這對那些試圖進行高度定製的的來說,ggplot並不是最好的選擇,儘管它也可以製作一些非常複雜、好看的圖形。
Bokeh
Bokeh是一個Python交互式可視化庫,支持現代化Web瀏覽器展示。它提供風格優雅、簡潔的D3.js的圖形化樣式,並將此功能擴展到高性能交互的數據集,數據流上。使用Bokeh可以快速便捷地創建交互式繪圖、儀錶板和數據應用程序等。
Bokeh能與NumPy、Pandas,Blaze等大部分數組或表格式的數據結構完美結合。
【Python】淺談python中的json
一 前言
最近一直在做開發相關的工作–基於Django的web 平台,其中需要從model層傳輸數據到view 層做數據展示或者做業務邏輯處理。我們採用通用的Json格式–Json(JavaScript Object Notation) 是一種輕量級的數據交換格式,易於閱讀和程序解析。
二 認識Json
2.1 Json 結構
常見的Json格式為 “名稱/值”對的集合,其中 值可以是對象,列表,字典,字符串等等。比如
backup_data = {“back_to_host”: “dbbk0”,
“ip_address”: “10.10.20.3”,
“host_name”: “rac4”,
“port”: 3306}
2.2 使用Json
Python的Json模塊序列化與反序列化的過程分別是 編碼和解碼。這兩個過程涉及到兩組不同的函數
編碼 把一個Python對象編碼轉換成Json字符串,json.dumps(data)/json.dump(data,file_handler)
解碼 把Json格式字符串解碼轉換成Python對象,json.loads(data)/json.load(file_handler)
在python中要使用Json模塊做相關操作,必須先導入:
import Json
2.3 主要函數
編碼函數主要有 json.dumps(data)/json.dump(data,file_handler)
json.dumps()的參數是將python對象轉換為字符串,如使用json.dumps序列化的對象json_dumps=json.dumps({‘a’:1, ‘b’:2}) ,json_dumps='{“b”: 2, “a”: 1}’
json.dump 是將內置類型序列化為json對象後寫入文件。
解碼函數主要由json.loads(data)/json.load(file_handler)
json.loads的參數是內存對象,把Json格式字符串解碼轉換成Python對象,json_loads=json.loads(d_json) #{ b”: 2, “a”: 1},使用load重新反序列化為dict
json.load()的參數針對文件句柄,比如本地有一個文件/tmp/test.json json_load=json.load(open(‘/tmp/test.json’))
具體案例參考如下:
In [3]: data={“back_to_host”: “rac1”,
…: “ip_address”: “10.215.20.3”,
…: “host_name”: “rac3”,
…: “port”: 3306}
In [7]: json_str=json.dumps(data)
In [8]: print json_str
{“ip_address”: “10.215.20.3”, “back_to_host”: “rac1”, “host_name”: “rac3”, “port”: 3306}
In [9]: json_loads=json.load(json_str)
—————————————————————————
AttributeError Traceback (most recent call last)
ipython-input-9-180506f16431 in module()
—- 1 json_loads=json.load(json_str)
/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/json/__init__.pyc in load(fp, encoding, cls, object_hook, parse_float, parse_int, parse_constant, object_pairs_hook, **kw)
284
285 “”
注意 從上面的報錯信息來看 json.loads 傳參是字符串類型,並不是文件句柄,沒有 read()屬性。
In [10]: json_loads=json.loads(json_str)
In [11]: print json_loads
{u’back_to_host’: u’rac1′, u’ip_address’: u’10.215.20.3′, u’host_name’: u’rac3′, u’port’: 3306}
In [12]: type(json_loads)
Out[12]: dict
In [13]: type(json_str)
Out[13]: str
利用dump 將數據寫入 dump.json
In [17]: with open(‘/tmp/dump.json’,’w’) as f:
…: json.dump(json_str,f)
…:
yangyiDBA:~ yangyi$ cat /tmp/dump.json
“{\”ip_address\”: \”10.10.20.3\”, \”back_to_host\”: \”rac1\”, \”host_name\”: \”rac3\”, \”port\”: 3306}”
yangyiDBA:~ yangyi$
利用json.load 將dump.sjon的數據讀出來並賦值給 data
In [18]: with open(‘/tmp/dump.json’,’r’) as f:
…: data=json.load(f)
…:
In [19]: print data
{“ip_address”: “10.10.20.3”, “back_to_host”: “rac1”, “host_name”: “rac3”, “port”: 3306}
三 小結
本文算是一篇學習筆記,主要對比了json.loads/json.load , json.dumps/ json.dump 的使用差異 ,方便以後更好的使用json 。
以上為本次分享內容,感謝觀看。
Python爬蟲(七)數據處理方法之JSON
JSON 指的是 JavaScript 對象表示法(JavaScript Object Notation),是輕量級的文本數據交換格式,且具有自我描述性,更易理解。
JSON看起來像python類型(列表,字典)的字符串。
在之前的文章中,我們說到了怎麼用response的方法,獲取到網頁正確解碼後的字符串。如果還有不懂的,可以先閱讀 Python爬蟲(三)Requests庫 。接下來以有道翻譯為例子,說說怎麼通過網頁解碼後的字符串,提取到翻譯結果。
再結合上述有道翻譯的例子,得到字典類型的返回結果,並提取出來翻譯結果。
將上述例子的dict_json換成str字符串,再寫入文本中。
執行完上述的程序,會得到一個fanyi.txt的文件,其結果如下:{“type”: “ZH_CN2EN”, “errorCode”: 0, “elapsedTime”: 1, “translateResult”: [[{“src”: “\u4eba\u751f\u82e6\u77ed\uff0c\u6211\u7528python”, “tgt”: “Life is too short, I use python”}]]}。這樣子的一份文檔,中文部分顯示的是二進制,且格式非常不利於閱讀,這並不是我們想要的結果。好在json.dumps()為我們提供的兩個方法,以幫助我們更好閱讀文檔。
1.ensure_ascii,能夠讓中文顯示成中文;
2.indent,能夠讓下一行在第一行的基礎上空格。
其用法如下:
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/250464.html