學習python強大的第三方庫,Python的第三方庫

本文目錄一覽：

1、Python常用的標準庫以及第三方庫有哪些？
2、Python數據分析庫有哪些
3、Python 常用的標準庫以及第三方庫有哪些
4、python第三方庫——xlwt3
5、值得收藏的Python第三方庫
6、python數據分析方向的第三方庫是什麼

Python常用的標準庫以及第三方庫有哪些？

Python常用的標準庫有http庫。第三方庫有scrapy，pillow和wxPython.以下有介紹：

Requests.Kenneth Reitz寫的最富盛名的http庫，每個Python程序員都應該有它。

Scrapy.如果你從事爬蟲相關的工作，那麼這個庫也是必不可少的。用過它之後你就不會再想用別的同類庫了。

wxPython.Python的一個GUI（圖形用戶界面）工具。我主要用它替代tkinter。

Pillow.它是PIL的一個友好分支。對於用戶比PIL更加友好，對於任何在圖形領域工作的人是必備的庫。

Python（英國發音：/ˈpaɪθən/ 美國發音：/ˈpaɪθɑːn/）, 是一種面向對象的解釋型計算機程序設計語言，由荷蘭人Guido van Rossum於1989年發明，第一個公開發行版發行於1991年。

Python數據分析庫有哪些

Python數據分析必備的第三方庫：

1、Pandas

Pandas是Python強大、靈活的數據分析和探索工具，包含Serise、DataFrame等高級數據結構和工具，安裝Pandas可使Python中處理數據非常快速和簡單。

Pandas是Python的一個數據分析包，Pandas最初使用用作金融數據分析工具而開發出來，因此Pandas為時間序列分析提供了很好的支持。

Pandas是為了解決數據分析任務而創建的，Pandas納入了大量的庫和一些標準的數據模型，提供了高效的操作大型數據集所需要的工具。Pandas提供了大量是我們快速便捷的處理數據的函數和方法。Pandas包含了高級數據結構，以及讓數據分析變得快速、簡單的工具。

2、Numpy

Numpy可以提供數組支持以及相應的高效處理函數，是Python數據分析的基礎，也是Scipy、Pandas等數據處理和科學計算庫最基本的函數功能庫，且其數據類型對Python數據分析十分有用。

Numpy提供了兩種基本的對象：ndarray和ufunc。ndarray是存儲單一數據類型的多維數組，而ufunc是能夠對數組進行處理的函數。

3、Matplotlib

Matplotlib是強大的數據可視化工具和作圖庫，是主要用於繪製數據圖表的Python庫，提供了繪製各類可視化圖形的命令字庫、簡單的接口，可以方便用戶輕鬆掌握圖形的格式，繪製各類可視化圖形。

Matplotlib是Python的一個可視化模塊，他能方便的只做線條圖、餅圖、柱狀圖以及其他專業圖形。

Matplotlib是基於Numpy的一套Python包，這個包提供了豐富的數據繪圖工具，主要用於繪製一些統計圖形。

4、SciPy

SciPy是一組專門解決科學計算中各種標準問題域的包的集合，包含的功能有最優化、線性代數、積分、插值、擬合、特殊函數、快速傅里葉變換、信號處理和圖像處理、常微分方程求解和其他科學與工程中常用的計算等，這些對數據分析和挖掘十分有用。

SciPy是一款方便、易於使用、專門為科學和工程設計的Python包，它包括統計、優化、整合、線性代數模塊、傅里葉變換、信號和圖像處理、常微分方程求解器等。Scipy依賴於Numpy，並提供許多對用戶友好的和有效的數值例程，如數值積分和優化。

5、Keras

Keras是深度學習庫，人工神經網絡和深度學習模型，基於Theano之上，依賴於Numpy和Scipy，利用它可以搭建普通的神經網絡和各種深度學習模型，如語言處理、圖像識別、自編碼器、循環神經網絡、遞歸審計網絡、卷積神經網絡等。

6、Scrapy

Scrapy是專門為爬蟲而生的工具，具有URL讀取、HTML解析、存儲數據等功能，可以使用Twisted異步網絡庫來處理網絡通訊，架構清晰，且包含了各種中間件接口，可以靈活的完成各種需求。

7、Gensim

Gensim是用來做文本主題模型的庫，常用於處理語言方面的任務，支持TF-IDF、LSA、LDA和Word2Vec在內的多種主題模型算法，支持流式訓練，並提供了諸如相似度計算、信息檢索等一些常用任務的API接口。

Python 常用的標準庫以及第三方庫有哪些

5個常用的Python標準庫：

1、os：提供了不少與操作系統相關聯的函數庫

os包是Python與操作系統的接口。我們可以用os包來實現操作系統的許多功能，比如管理系統進程，改變當前路徑，改變文件權限等。但要注意，os包是建立在操作系統的平台上的，許多功能在Windows系統上是無法實現的。另外，在使用os包中，要注意其中的有些功能已經被其他的包取代。

我們通過文件系統來管理磁盤上儲存的文件。查找、刪除、複製文件以及列出文件列表等都是常見的文件操作。這些功能通常可以在操作系統中看到，但現在可以通過Python標準庫中的glob包、shutil包、os.path包以及os包的一些函數等，在Python內部實現。

2、sys：通常用於命令行參數的庫

sys包被用於管理Python自身的運行環境。Python是一個解釋器，也是一個運行在操作系統上的程序。我們可以用sys包來控制這一程序運行的許多參數，比如說Python運行所能佔據的內存和CPU，Python所要掃描的路徑等。另一個重要功能是和Python自己的命令行互動，從命令行讀取命令和參數。

3、random：用於生成隨機數的庫

Python標準庫中的random函數，可以生成隨機浮點數、整數、字符串，甚至幫助你隨機選擇列表序列中的一個元素，打亂一組數據等。

4、math：提供了數學常數和數學函數

標準庫中，Python定義了一些新的數字類型，以彌補之前的數字類型可能的不足。標準庫還包含了random包，用於處理隨機數相關的功能。math包補充了一些重要的數學常數和數學函數，比如pi、三角函數等等。

5、datetime：日期和時間的操作庫

日期和時間的管理並不複雜，但容易犯錯。Python的標準庫中對日期和時間的管理頗為完善，你不僅可以進行日期時間的查詢和變換，還可以對日期時間進行運算。通過這些標準庫，還可以根據需要控制日期時間輸出的文本格式。

除此之外，Python還有很多第三方庫，了解更多可移步：oldboyedu

python第三方庫——xlwt3

我們之前已經學習了xlrd這個庫，這個庫是讀取excel表格內信息的，它並不能寫入信息，這時候我們需要使用xlwt3這個庫進行excel表格的寫入。

打開命令提示符，使用pip進行安裝

安裝完後進入下一步：

這個xlwt3的庫，好像已經很久沒有人維護了，所以有一個問題就是，你用pip安裝的這個庫，是有點問題的，需要咱們手動修改。

打開python的安裝目錄，就是你的python的安裝位置，我的在D盤，找到D：\Python34\Lib\site-packages\xlwt3\formula.py這個文件，右鍵點擊，使用IDLE打開

將其中的

修改為

就是把第一個” __init__ “刪掉。

打開python shell

使用 import xlwt3 ，看看報不報錯，沒有報錯說明修改成功。安裝完成。

我們使用這個包主要是為了生成excel表格，將我們處理好的數據存到excel表格中。

為此，我們需要的是xlwt3裡面的Workbook這個類。

先創建實例：

這樣就創建完了一個實例。

我們知道，一個.xlsx文件或.xls文件稱為一個工作簿，裡面有好幾張工作表，我們現在創建的這個Workbook()實例，它也是一個工作簿，我們要寫入內容的話是要寫進工作表裡面的，這就需要我們創建一個工作表，工作表名是’test1’。

使用的是Workbook下屬的add_sheet方法，add_sheet，新建工作表。

add_sheet(self, sheetname, cell_overwrite_ok=False)

需要注意的是，這個方法有兩個參數

· 第一個是sheetname，這個是工作表的名字，必須要設置的

· 另一個參數是cell_overwrite_ok，這個參數是覆寫的意思，默認是False，如果你現在要寫的單元格裡面，已經有內容了，就不能寫了，如果你要是寫的話會報錯的。當然，我們在使用的時候，最好是設置成True。也就是上面的那個寫法。這樣對同一個單元格寫入兩次的話就不會報錯了，當然，只會保留最後一次寫入的值。

接下來可以寫入信息了。

事實上，我們剛才使用add_sheet這個方法後，創建出了一個Worksheet類的實例。這個類有兩個方法是我們需要使用的，一個是write，另一個是write_merge。前者用來寫入一個單元格的內容，後者用來寫入一個合併單元格的內容。

我們先看write方法，裡面有四個參數，分別是r，c，label，style，

· r是行

· c是列

· label是內容

· style是格式

上面寫的 table.write(1,0,’number’) 是在第二行的第一列寫入’number’這個字符串。

同理，另外兩句分別是在第二行的第二列和第二行的第三列寫入’name’和’score’這兩個字符串。

write_merge是寫合併單元格的方法

· r1是最上面的單元格所在的行數

· r2是最下面的單元格所在的行數

· c1是最左面的單元格所在的列數

· c2是最右面的單元格所在的列數

· label是要寫入的內容

· style是格式

上面那個 table.write_merge(0,0,0,2,’Student information’) ，是把第0行的第一列，第二列，第三列的單元格合併了，在裡面寫入’Student information’這個字符串。

如果我們寫入信息的時候，不加style這個參數，那麼裡面的信息就是最普通的，沒有什麼格式，顏色啊，粗體啊，邊框啊，什麼的。

在xlwt3中，使用easyxf這個函數來設置單元格屬性。

比如這句當中，我們可以看到傳入了一個字符串作為參數：

‘font: bold on, italic on, name 宋體, height 400, color red; align: vert centre, horiz centre; borders: top THIN,left THIN,right THIN,bottom THIN’

分解來看，這個字符串有三部分：

我們剛才不是用

創建了一個單元格屬性嗎，紅色20號宋體，粗體，斜體，四周有邊框，居中。

寫入的使用加在作為style參數傳入。

這樣，我們就成功的設置單元格格式了。

接下來我們設置列寬。

使用這個方法就能設置列寬了，裡面的0代表第一列，列寬是20。我也不知道這個列寬是怎麼換算的，只要設置5293的話就是20，大家可以根據換算設置自己想要的列寬。

最後一步，保存我們建立的工作簿。

這裡面就一個參數，你要保存的excel表格的文件名。需要加路徑和後綴名的。需要注意的是，這個xlwt3隻能保存成.xls的excel文件。

打開我們保存的excel表格。

可以看到，工作表名是我們設置的test1，第一行的前三個單元格合併了，內容是’Student information’，紅色20號宋體，粗體，斜體，四周有邊框，居中。第二行分別是number，name，score。

以上就是創建這個excel表格的流程。

剛才上pypi發現，這個包好像就要被移除了，這樣的話以後用pip就無法安裝了。

xlwt3 0.1.2 : Python Package Index

以上就是關於xlwt3這個包的簡單教程。

值得收藏的Python第三方庫

網絡站點爬取

爬取網絡站點的庫Scrapy – 一個快速高級的屏幕爬取及網頁採集框架。cola – 一個分布式爬蟲框架。Demiurge – 基於PyQuery 的爬蟲微型框架。feedparser – 通用 feed 解析器。Grab – 站點爬取框架。MechanicalSoup – 用於自動和網絡站點交互的 Python 庫。portia – Scrapy 可視化爬取。pyspider – 一個強大的爬蟲系統。RoboBrowser – 一個簡單的，Python 風格的庫，用來瀏覽網站，而不需要一個獨立安裝的瀏覽器。

交互式解析器

交互式 Python 解析器。

IPython – 功能豐富的工具，非常有效的使用交互式 Python。

bpython- 界面豐富的 Python 解析器。

ptpython – 高級交互式Python解析器，構建於python-prompt-toolkit 之上。

圖像處理

用來操作圖像的庫.

pillow – Pillow 是一個更加易用版的 PIL。

hmap – 圖像直方圖映射。

imgSeek – 一個使用視覺相似性搜索一組圖片集合的項目。

nude.py – 裸體檢測。

pyBarcode – 不藉助 PIL 庫在 Python 程序中生成條形碼。

pygram – 類似 Instagram 的圖像濾鏡。

python-qrcode – 一個純 Python 實現的二維碼生成器。

Quads – 基於四叉樹的計算機藝術。

scikit-image – 一個用於（科學）圖像處理的 Python 庫。

thumbor – 一個小型圖像服務，具有剪裁，尺寸重設和翻轉功能。

wand – MagickWand的Python 綁定。MagickWand 是 ImageMagick的 C API 。

HTTP

使用HTTP的庫。

requests – 人性化的HTTP請求庫。

grequests – requests 庫 + gevent ，用於異步 HTTP 請求.

httplib2 – 全面的 HTTP 客戶端庫。

treq – 類似 requests 的Python API 構建於 Twisted HTTP 客戶端之上。

urllib3 – 一個具有線程安全連接池，支持文件 post，清晰友好的 HTTP 庫。

數據庫

Python實現的數據庫。

pickleDB – 一個簡單，輕量級鍵值儲存數據庫。

PipelineDB – 流式 SQL 數據庫。

TinyDB – 一個微型的，面向文檔型數據庫。

ZODB – 一個 Python 原生對象數據庫。一個鍵值和對象圖數據庫。

Web 框架

全棧 web 框架。

Django – Python 界最流行的 web 框架。

awesome-django系列

Flask – 一個 Python 微型框架。

系列

Pyramid – 一個小巧，快速，接地氣的開源Python web 框架。

awesome-pyramid系列

Bottle – 一個快速小巧，輕量級的 WSGI 微型 web 框架。

CherryPy – 一個極簡的 Python web 框架，服從 HTTP/1.1 協議且具有WSGI 線程池。

TurboGears – 一個可以擴展為全棧解決方案的微型框架。

web.py – 一個 Python 的 web 框架，既簡單，又強大。

web2py – 一個全棧 web 框架和平台，專註於簡單易用。

Tornado – 一個web 框架和異步網絡庫。

HTML處理

處理 HTML和XML的庫。

BeautifulSoup – 以 Python 風格的方式來對 HTML 或 XML 進行迭代，搜索和修改。

bleach – 一個基於白名單的 HTML 清理和文本鏈接庫。

cssutils – 一個 Python 的 CSS 庫。

html5lib – 一個兼容標準的 HTML 文檔和片段解析及序列化庫。

lxml – 一個非常快速，簡單易用，功能齊全的庫，用來處理 HTML 和 XML。

MarkupSafe – 為Python 實現 XML/HTML/XHTML 標記安全字符串。

pyquery – 一個解析 HTML 的庫，類似 jQuery。

untangle – 將XML文檔轉換為Python對象，使其可以方便的訪問。

xhtml2pdf – HTML/CSS 轉 PDF 工具。

xmltodict – 像處理 JSON 一樣處理 XML。

遊戲開發

超贊的遊戲開發庫。

Cocos2d – cocos2d 是一個用來開發 2D 遊戲，示例和其他圖形/交互應用的框架。基於 pyglet。

Panda3D – 由迪士尼開發的 3D 遊戲引擎，並由卡內基梅隴娛樂技術中心負責維護。使用C++編寫, 針對 Python 進行了完全的封裝。

Pygame – Pygame 是一組 Python 模塊，用來編寫遊戲。

PyOgre – Ogre 3D 渲染引擎的 Python 綁定，可以用來開發遊戲和仿真程序等任何 3D 應用。

PyOpenGL – OpenGL 的 Python 綁定及其相關 APIs。

PySDL2 – SDL2 庫的封裝，基於 ctypes。

RenPy – 一個視覺小說（visual novel）引擎。

python數據分析方向的第三方庫是什麼

Python除了有200個標準庫以外，還有10萬個第三方擴展庫，囊括了方方面面。其中做數據分析最常用到的庫有4個：

Numpy

Numpy是Python科學計算的基礎包。它除了為Python提供快速的數組處理能力，還是在算法和庫之間傳遞數據的容器。對於數值型數據，NumPy數組在存儲和處理數據時要比內置的 Python數據結構高效得多。此外，由低級語言（比如C和Fortran）編寫的庫可以直接操作NumPy 數組中的數據，無需進行任何數據複製工作。因此，許多Python的數值計算工具要麼使用NumPy 數組作為主要的數據結構，要麼可以與NumPy進行無縫交互操作。

Pandas

Pandas提供了快速便捷處理結構化數據的大量數據結構和函數，兼具NumPy高性能的數組計算功能以及電子表格和關係型數據庫（如SQL）靈活的數據處理功能。它提供了複雜精細的索引功能，能更加便捷地完成重塑、切片和切塊、聚合以及選取數據子集等操作。因為數據操作、準備、清洗是數據分析最重要的技能，所以Pandas也是學習的重點。

Matplotlib

Matplotlib是最流行的用於繪製圖表和其它二維數據可視化的Python庫，它非常適合創建出版物上用的圖表。雖然還有其它的Python可視化庫，但Matplotlib卻是使用最廣泛的，並且它和其它生態工具配合也非常完美。

Scikit-learn

Scikit-learn是Python的通用機器學習工具包。它的子模塊包括分類、回歸、聚類、降維、選型、預處理，對於Python成為高效數據科學編程語言起到了關鍵作用。

原創文章，作者：WXMA，如若轉載，請註明出處：https://www.506064.com/zh-hant/n/134518.html