本文目錄一覽:
- 1、Python常用的標準庫以及第三方庫有哪些?
- 2、Python數據分析庫有哪些
- 3、Python 常用的標準庫以及第三方庫有哪些
- 4、python第三方庫——xlwt3
- 5、值得收藏的Python第三方庫
- 6、python數據分析方向的第三方庫是什麼
Python常用的標準庫以及第三方庫有哪些?
Python常用的標準庫有http庫。第三方庫有scrapy,pillow和wxPython.以下有介紹:
Requests.Kenneth Reitz寫的最富盛名的http庫,每個Python程序員都應該有它。
Scrapy.如果你從事爬蟲相關的工作,那麼這個庫也是必不可少的。用過它之後你就不會再想用別的同類庫了。
wxPython.Python的一個GUI(圖形用戶界面)工具。我主要用它替代tkinter。
Pillow.它是PIL的一個友好分支。對於用戶比PIL更加友好,對於任何在圖形領域工作的人是必備的庫。
Python(英國發音:/ˈpaɪθən/ 美國發音:/ˈpaɪθɑːn/), 是一種面向對象的解釋型計算機程序設計語言,由荷蘭人Guido van Rossum於1989年發明,第一個公開發行版發行於1991年。
Python數據分析庫有哪些
Python數據分析必備的第三方庫:
1、Pandas
Pandas是Python強大、靈活的數據分析和探索工具,包含Serise、DataFrame等高級數據結構和工具,安裝Pandas可使Python中處理數據非常快速和簡單。
Pandas是Python的一個數據分析包,Pandas最初使用用作金融數據分析工具而開發出來,因此Pandas為時間序列分析提供了很好的支持。
Pandas是為了解決數據分析任務而創建的,Pandas納入了大量的庫和一些標準的數據模型,提供了高效的操作大型數據集所需要的工具。Pandas提供了大量是我們快速便捷的處理數據的函數和方法。Pandas包含了高級數據結構,以及讓數據分析變得快速、簡單的工具。
2、Numpy
Numpy可以提供數組支持以及相應的高效處理函數,是Python數據分析的基礎,也是Scipy、Pandas等數據處理和科學計算庫最基本的函數功能庫,且其數據類型對Python數據分析十分有用。
Numpy提供了兩種基本的對象:ndarray和ufunc。ndarray是存儲單一數據類型的多維數組,而ufunc是能夠對數組進行處理的函數。
3、Matplotlib
Matplotlib是強大的數據可視化工具和作圖庫,是主要用於繪製數據圖表的Python庫,提供了繪製各類可視化圖形的命令字庫、簡單的接口,可以方便用戶輕鬆掌握圖形的格式,繪製各類可視化圖形。
Matplotlib是Python的一個可視化模塊,他能方便的只做線條圖、餅圖、柱狀圖以及其他專業圖形。
Matplotlib是基於Numpy的一套Python包,這個包提供了豐富的數據繪圖工具,主要用於繪製一些統計圖形。
4、SciPy
SciPy是一組專門解決科學計算中各種標準問題域的包的集合,包含的功能有最優化、線性代數、積分、插值、擬合、特殊函數、快速傅里葉變換、信號處理和圖像處理、常微分方程求解和其他科學與工程中常用的計算等,這些對數據分析和挖掘十分有用。
SciPy是一款方便、易於使用、專門為科學和工程設計的Python包,它包括統計、優化、整合、線性代數模塊、傅里葉變換、信號和圖像處理、常微分方程求解器等。Scipy依賴於Numpy,並提供許多對用戶友好的和有效的數值例程,如數值積分和優化。
5、Keras
Keras是深度學習庫,人工神經網絡和深度學習模型,基於Theano之上,依賴於Numpy和Scipy,利用它可以搭建普通的神經網絡和各種深度學習模型,如語言處理、圖像識別、自編碼器、循環神經網絡、遞歸審計網絡、卷積神經網絡等。
6、Scrapy
Scrapy是專門為爬蟲而生的工具,具有URL讀取、HTML解析、存儲數據等功能,可以使用Twisted異步網絡庫來處理網絡通訊,架構清晰,且包含了各種中間件接口,可以靈活的完成各種需求。
7、Gensim
Gensim是用來做文本主題模型的庫,常用於處理語言方面的任務,支持TF-IDF、LSA、LDA和Word2Vec在內的多種主題模型算法,支持流式訓練,並提供了諸如相似度計算、信息檢索等一些常用任務的API接口。
Python 常用的標準庫以及第三方庫有哪些
5個常用的Python標準庫:
1、os:提供了不少與操作系統相關聯的函數庫
os包是Python與操作系統的接口。我們可以用os包來實現操作系統的許多功能,比如管理系統進程,改變當前路徑,改變文件權限等。但要注意,os包是建立在操作系統的平台上的,許多功能在Windows系統上是無法實現的。另外,在使用os包中,要注意其中的有些功能已經被其他的包取代。
我們通過文件系統來管理磁盤上儲存的文件。查找、刪除、複製文件以及列出文件列表等都是常見的文件操作。這些功能通常可以在操作系統中看到,但現在可以通過Python標準庫中的glob包、shutil包、os.path包以及os包的一些函數等,在Python內部實現。
2、sys:通常用於命令行參數的庫
sys包被用於管理Python自身的運行環境。Python是一個解釋器,也是一個運行在操作系統上的程序。我們可以用sys包來控制這一程序運行的許多參數,比如說Python運行所能佔據的內存和CPU,Python所要掃描的路徑等。另一個重要功能是和Python自己的命令行互動,從命令行讀取命令和參數。
3、random:用於生成隨機數的庫
Python標準庫中的random函數,可以生成隨機浮點數、整數、字符串,甚至幫助你隨機選擇列表序列中的一個元素,打亂一組數據等。
4、math:提供了數學常數和數學函數
標準庫中,Python定義了一些新的數字類型,以彌補之前的數字類型可能的不足。標準庫還包含了random包,用於處理隨機數相關的功能。math包補充了一些重要的數學常數和數學函數,比如pi、三角函數等等。
5、datetime:日期和時間的操作庫
日期和時間的管理並不複雜,但容易犯錯。Python的標準庫中對日期和時間的管理頗為完善,你不僅可以進行日期時間的查詢和變換,還可以對日期時間進行運算。通過這些標準庫,還可以根據需要控制日期時間輸出的文本格式。
除此之外,Python還有很多第三方庫,了解更多可移步:oldboyedu
python第三方庫——xlwt3
我們之前已經學習了xlrd這個庫,這個庫是讀取excel表格內信息的,它並不能寫入信息,這時候我們需要使用xlwt3這個庫進行excel表格的寫入。
打開命令提示符,使用pip進行安裝
安裝完後進入下一步:
這個xlwt3的庫,好像已經很久沒有人維護了,所以有一個問題就是,你用pip安裝的這個庫,是有點問題的,需要咱們手動修改。
打開python的安裝目錄,就是你的python的安裝位置,我的在D盤,找到D:\Python34\Lib\site-packages\xlwt3\formula.py這個文件,右鍵點擊,使用IDLE打開
將其中的
修改為
就是把第一個” __init__ “刪掉。
打開python shell
使用 import xlwt3 ,看看報不報錯,沒有報錯說明修改成功。安裝完成。
我們使用這個包主要是為了生成excel表格,將我們處理好的數據存到excel表格中。
為此,我們需要的是xlwt3裡面的Workbook這個類。
先創建實例:
這樣就創建完了一個實例。
我們知道,一個.xlsx文件或.xls文件稱為一個工作簿,裡面有好幾張工作表,我們現在創建的這個Workbook()實例,它也是一個工作簿,我們要寫入內容的話是要寫進工作表裡面的,這就需要我們創建一個工作表,工作表名是’test1’。
使用的是Workbook下屬的add_sheet方法,add_sheet,新建工作表。
add_sheet(self, sheetname, cell_overwrite_ok=False)
需要注意的是,這個方法有兩個參數
· 第一個是sheetname,這個是工作表的名字,必須要設置的
· 另一個參數是cell_overwrite_ok,這個參數是覆寫的意思,默認是False,如果你現在要寫的單元格裡面,已經有內容了,就不能寫了,如果你要是寫的話會報錯的。當然,我們在使用的時候,最好是設置成True。也就是上面的那個寫法。這樣對同一個單元格寫入兩次的話就不會報錯了,當然,只會保留最後一次寫入的值。
接下來可以寫入信息了。
事實上,我們剛才使用add_sheet這個方法後,創建出了一個Worksheet類的實例。這個類有兩個方法是我們需要使用的,一個是write,另一個是write_merge。前者用來寫入一個單元格的內容,後者用來寫入一個合併單元格的內容。
我們先看write方法,裡面有四個參數,分別是r,c,label,style,
· r是行
· c是列
· label是內容
· style是格式
上面寫的 table.write(1,0,’number’) 是在第二行的第一列寫入’number’這個字符串。
同理,另外兩句分別是在第二行的第二列和第二行的第三列寫入’name’和’score’這兩個字符串。
write_merge是寫合併單元格的方法
· r1是最上面的單元格所在的行數
· r2是最下面的單元格所在的行數
· c1是最左面的單元格所在的列數
· c2是最右面的單元格所在的列數
· label是要寫入的內容
· style是格式
上面那個 table.write_merge(0,0,0,2,’Student information’) ,是把第0行的第一列,第二列,第三列的單元格合併了,在裡面寫入’Student information’這個字符串。
如果我們寫入信息的時候,不加style這個參數,那麼裡面的信息就是最普通的,沒有什麼格式,顏色啊,粗體啊,邊框啊,什麼的。
在xlwt3中,使用easyxf這個函數來設置單元格屬性。
比如這句當中,我們可以看到傳入了一個字符串作為參數:
‘font: bold on, italic on, name 宋體, height 400, color red; align: vert centre, horiz centre; borders: top THIN,left THIN,right THIN,bottom THIN’
分解來看,這個字符串有三部分:
我們剛才不是用
創建了一個單元格屬性嗎,紅色20號宋體,粗體,斜體,四周有邊框,居中。
寫入的使用加在作為style參數傳入。
這樣,我們就成功的設置單元格格式了。
接下來我們設置列寬。
使用這個方法就能設置列寬了,裡面的0代表第一列,列寬是20。我也不知道這個列寬是怎麼換算的,只要設置5293的話就是20,大家可以根據換算設置自己想要的列寬。
最後一步,保存我們建立的工作簿。
這裡面就一個參數,你要保存的excel表格的文件名。需要加路徑和後綴名的。需要注意的是,這個xlwt3隻能保存成.xls的excel文件。
打開我們保存的excel表格。
可以看到,工作表名是我們設置的test1,第一行的前三個單元格合併了,內容是’Student information’,紅色20號宋體,粗體,斜體,四周有邊框,居中。第二行分別是number,name,score。
以上就是創建這個excel表格的流程。
剛才上pypi發現,這個包好像就要被移除了,這樣的話以後用pip就無法安裝了。
xlwt3 0.1.2 : Python Package Index
以上就是關於xlwt3這個包的簡單教程。
值得收藏的Python第三方庫
網絡站點爬取
爬取網絡站點的庫Scrapy – 一個快速高級的屏幕爬取及網頁採集框架。cola – 一個分布式爬蟲框架。Demiurge – 基於PyQuery 的爬蟲微型框架。feedparser – 通用 feed 解析器。Grab – 站點爬取框架。MechanicalSoup – 用於自動和網絡站點交互的 Python 庫。portia – Scrapy 可視化爬取。pyspider – 一個強大的爬蟲系統。RoboBrowser – 一個簡單的,Python 風格的庫,用來瀏覽網站,而不需要一個獨立安裝的瀏覽器。
交互式解析器
交互式 Python 解析器。
IPython – 功能豐富的工具,非常有效的使用交互式 Python。
bpython- 界面豐富的 Python 解析器。
ptpython – 高級交互式Python解析器, 構建於python-prompt-toolkit 之上。
圖像處理
用來操作圖像的庫.
pillow – Pillow 是一個更加易用版的 PIL。
hmap – 圖像直方圖映射。
imgSeek – 一個使用視覺相似性搜索一組圖片集合的項目。
nude.py – 裸體檢測。
pyBarcode – 不藉助 PIL 庫在 Python 程序中生成條形碼。
pygram – 類似 Instagram 的圖像濾鏡。
python-qrcode – 一個純 Python 實現的二維碼生成器。
Quads – 基於四叉樹的計算機藝術。
scikit-image – 一個用於(科學)圖像處理的 Python 庫。
thumbor – 一個小型圖像服務,具有剪裁,尺寸重設和翻轉功能。
wand – MagickWand的Python 綁定。MagickWand 是 ImageMagick的 C API 。
HTTP
使用HTTP的庫。
requests – 人性化的HTTP請求庫。
grequests – requests 庫 + gevent ,用於異步 HTTP 請求.
httplib2 – 全面的 HTTP 客戶端庫。
treq – 類似 requests 的Python API 構建於 Twisted HTTP 客戶端之上。
urllib3 – 一個具有線程安全連接池,支持文件 post,清晰友好的 HTTP 庫。
數據庫
Python實現的數據庫。
pickleDB – 一個簡單,輕量級鍵值儲存數據庫。
PipelineDB – 流式 SQL 數據庫。
TinyDB – 一個微型的,面向文檔型數據庫。
ZODB – 一個 Python 原生對象數據庫。一個鍵值和對象圖數據庫。
Web 框架
全棧 web 框架。
Django – Python 界最流行的 web 框架。
awesome-django系列
Flask – 一個 Python 微型框架。
系列
Pyramid – 一個小巧,快速,接地氣的開源Python web 框架。
awesome-pyramid系列
Bottle – 一個快速小巧,輕量級的 WSGI 微型 web 框架。
CherryPy – 一個極簡的 Python web 框架,服從 HTTP/1.1 協議且具有WSGI 線程池。
TurboGears – 一個可以擴展為全棧解決方案的微型框架。
web.py – 一個 Python 的 web 框架,既簡單,又強大。
web2py – 一個全棧 web 框架和平台,專註於簡單易用。
Tornado – 一個web 框架和異步網絡庫。
HTML處理
處理 HTML和XML的庫。
BeautifulSoup – 以 Python 風格的方式來對 HTML 或 XML 進行迭代,搜索和修改。
bleach – 一個基於白名單的 HTML 清理和文本鏈接庫。
cssutils – 一個 Python 的 CSS 庫。
html5lib – 一個兼容標準的 HTML 文檔和片段解析及序列化庫。
lxml – 一個非常快速,簡單易用,功能齊全的庫,用來處理 HTML 和 XML。
MarkupSafe – 為Python 實現 XML/HTML/XHTML 標記安全字符串。
pyquery – 一個解析 HTML 的庫,類似 jQuery。
untangle – 將XML文檔轉換為Python對象,使其可以方便的訪問。
xhtml2pdf – HTML/CSS 轉 PDF 工具。
xmltodict – 像處理 JSON 一樣處理 XML。
遊戲開發
超贊的遊戲開發庫。
Cocos2d – cocos2d 是一個用來開發 2D 遊戲, 示例和其他圖形/交互應用的框架。基於 pyglet。
Panda3D – 由迪士尼開發的 3D 遊戲引擎,並由卡內基梅隴娛樂技術中心負責維護。使用C++編寫, 針對 Python 進行了完全的封裝。
Pygame – Pygame 是一組 Python 模塊,用來編寫遊戲。
PyOgre – Ogre 3D 渲染引擎的 Python 綁定,可以用來開發遊戲和仿真程序等任何 3D 應用。
PyOpenGL – OpenGL 的 Python 綁定及其相關 APIs。
PySDL2 – SDL2 庫的封裝,基於 ctypes。
RenPy – 一個視覺小說(visual novel)引擎。
python數據分析方向的第三方庫是什麼
Python除了有200個標準庫以外,還有10萬個第三方擴展庫,囊括了方方面面。其中做數據分析最常用到的庫有4個:
Numpy
Numpy是Python科學計算的基礎包。它除了為Python提供快速的數組處理能力,還是在算法和庫之間傳遞數據的容器。對於數值型數據,NumPy數組在存儲和處理數據時要比內置的 Python數據結構高效得多。此外,由低級語言(比如C和Fortran)編寫的庫可以直接操作NumPy 數組中的數據,無需進行任何數據複製工作。因此,許多Python的數值計算工具要麼使用NumPy 數組作為主要的數據結構,要麼可以與NumPy進行無縫交互操作。
Pandas
Pandas提供了快速便捷處理結構化數據的大量數據結構和函數,兼具NumPy高性能的數組計算功能以及電子表格和關係型數據庫(如SQL)靈活的數據處理功能。它提供了複雜精細的索引功能,能更加便捷地完成重塑、切片和切塊、聚合以及選取數據子集等操作。因為數據操作、準備、清洗是數據分析最重要的技能,所以Pandas也是學習的重點。
Matplotlib
Matplotlib是最流行的用於繪製圖表和其它二維數據可視化的Python庫,它非常適合創建出版物上用的圖表。雖然還有其它的Python可視化庫,但Matplotlib卻是使用最廣泛的,並且它和其它生態工具配合也非常完美。
Scikit-learn
Scikit-learn是Python的通用機器學習工具包。它的子模塊包括分類、回歸、聚類、降維、選型、預處理,對於Python成為高效數據科學編程語言起到了關鍵作用。
原創文章,作者:WXMA,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/134518.html