學習python強大的第三方庫,Python的第三方庫

本文目錄一覽:

Python常用的標準庫以及第三方庫有哪些?

Python常用的標準庫有http庫。第三方庫有scrapy,pillow和wxPython.以下有介紹:

Requests.Kenneth Reitz寫的最富盛名的http庫,每個Python程序員都應該有它。

Scrapy.如果你從事爬蟲相關的工作,那麼這個庫也是必不可少的。用過它之後你就不會再想用別的同類庫了。

wxPython.Python的一個GUI(圖形用戶界面)工具。我主要用它替代tkinter。

Pillow.它是PIL的一個友好分支。對於用戶比PIL更加友好,對於任何在圖形領域工作的人是必備的庫。

Python(英國發音:/ˈpaɪθən/ 美國發音:/ˈpaɪθɑːn/), 是一種面向對象的解釋型計算機程序設計語言,由荷蘭人Guido van Rossum於1989年發明,第一個公開發行版發行於1991年。

Python數據分析庫有哪些

Python數據分析必備的第三方庫:

1、Pandas

Pandas是Python強大、靈活的數據分析和探索工具,包含Serise、DataFrame等高級數據結構和工具,安裝Pandas可使Python中處理數據非常快速和簡單。

Pandas是Python的一個數據分析包,Pandas最初使用用作金融數據分析工具而開發出來,因此Pandas為時間序列分析提供了很好的支持。

Pandas是為了解決數據分析任務而創建的,Pandas納入了大量的庫和一些標準的數據模型,提供了高效的操作大型數據集所需要的工具。Pandas提供了大量是我們快速便捷的處理數據的函數和方法。Pandas包含了高級數據結構,以及讓數據分析變得快速、簡單的工具。

2、Numpy

Numpy可以提供數組支持以及相應的高效處理函數,是Python數據分析的基礎,也是Scipy、Pandas等數據處理和科學計算庫最基本的函數功能庫,且其數據類型對Python數據分析十分有用。

Numpy提供了兩種基本的對象:ndarray和ufunc。ndarray是存儲單一數據類型的多維數組,而ufunc是能夠對數組進行處理的函數。

3、Matplotlib

Matplotlib是強大的數據可視化工具和作圖庫,是主要用於繪製數據圖表的Python庫,提供了繪製各類可視化圖形的命令字庫、簡單的接口,可以方便用戶輕鬆掌握圖形的格式,繪製各類可視化圖形。

Matplotlib是Python的一個可視化模塊,他能方便的只做線條圖、餅圖、柱狀圖以及其他專業圖形。

Matplotlib是基於Numpy的一套Python包,這個包提供了豐富的數據繪圖工具,主要用於繪製一些統計圖形。

4、SciPy

SciPy是一組專門解決科學計算中各種標準問題域的包的集合,包含的功能有最優化、線性代數、積分、插值、擬合、特殊函數、快速傅里葉變換、信號處理和圖像處理、常微分方程求解和其他科學與工程中常用的計算等,這些對數據分析和挖掘十分有用。

SciPy是一款方便、易於使用、專門為科學和工程設計的Python包,它包括統計、優化、整合、線性代數模塊、傅里葉變換、信號和圖像處理、常微分方程求解器等。Scipy依賴於Numpy,並提供許多對用戶友好的和有效的數值例程,如數值積分和優化。

5、Keras

Keras是深度學習庫,人工神經網絡和深度學習模型,基於Theano之上,依賴於Numpy和Scipy,利用它可以搭建普通的神經網絡和各種深度學習模型,如語言處理、圖像識別、自編碼器、循環神經網絡、遞歸審計網絡、卷積神經網絡等。

6、Scrapy

Scrapy是專門為爬蟲而生的工具,具有URL讀取、HTML解析、存儲數據等功能,可以使用Twisted異步網絡庫來處理網絡通訊,架構清晰,且包含了各種中間件接口,可以靈活的完成各種需求。

7、Gensim

Gensim是用來做文本主題模型的庫,常用於處理語言方面的任務,支持TF-IDF、LSA、LDA和Word2Vec在內的多種主題模型算法,支持流式訓練,並提供了諸如相似度計算、信息檢索等一些常用任務的API接口。

Python 常用的標準庫以及第三方庫有哪些

5個常用的Python標準庫:

1、os:提供了不少與操作系統相關聯的函數庫

os包是Python與操作系統的接口。我們可以用os包來實現操作系統的許多功能,比如管理系統進程,改變當前路徑,改變文件權限等。但要注意,os包是建立在操作系統的平台上的,許多功能在Windows系統上是無法實現的。另外,在使用os包中,要注意其中的有些功能已經被其他的包取代。

我們通過文件系統來管理磁盤上儲存的文件。查找、刪除、複製文件以及列出文件列表等都是常見的文件操作。這些功能通常可以在操作系統中看到,但現在可以通過Python標準庫中的glob包、shutil包、os.path包以及os包的一些函數等,在Python內部實現。

2、sys:通常用於命令行參數的庫

sys包被用於管理Python自身的運行環境。Python是一個解釋器,也是一個運行在操作系統上的程序。我們可以用sys包來控制這一程序運行的許多參數,比如說Python運行所能佔據的內存和CPU,Python所要掃描的路徑等。另一個重要功能是和Python自己的命令行互動,從命令行讀取命令和參數。

3、random:用於生成隨機數的庫

Python標準庫中的random函數,可以生成隨機浮點數、整數、字符串,甚至幫助你隨機選擇列表序列中的一個元素,打亂一組數據等。

4、math:提供了數學常數和數學函數

標準庫中,Python定義了一些新的數字類型,以彌補之前的數字類型可能的不足。標準庫還包含了random包,用於處理隨機數相關的功能。math包補充了一些重要的數學常數和數學函數,比如pi、三角函數等等。

5、datetime:日期和時間的操作庫

日期和時間的管理並不複雜,但容易犯錯。Python的標準庫中對日期和時間的管理頗為完善,你不僅可以進行日期時間的查詢和變換,還可以對日期時間進行運算。通過這些標準庫,還可以根據需要控制日期時間輸出的文本格式。

除此之外,Python還有很多第三方庫,了解更多可移步:oldboyedu

python第三方庫——xlwt3

我們之前已經學習了xlrd這個庫,這個庫是讀取excel表格內信息的,它並不能寫入信息,這時候我們需要使用xlwt3這個庫進行excel表格的寫入。

打開命令提示符,使用pip進行安裝

安裝完後進入下一步:

這個xlwt3的庫,好像已經很久沒有人維護了,所以有一個問題就是,你用pip安裝的這個庫,是有點問題的,需要咱們手動修改。

打開python的安裝目錄,就是你的python的安裝位置,我的在D盤,找到D:\Python34\Lib\site-packages\xlwt3\formula.py這個文件,右鍵點擊,使用IDLE打開

將其中的

修改為

就是把第一個” __init__ “刪掉。

打開python shell

使用 import xlwt3 ,看看報不報錯,沒有報錯說明修改成功。安裝完成。

我們使用這個包主要是為了生成excel表格,將我們處理好的數據存到excel表格中。

為此,我們需要的是xlwt3裡面的Workbook這個類。

先創建實例:

這樣就創建完了一個實例。

我們知道,一個.xlsx文件或.xls文件稱為一個工作簿,裡面有好幾張工作表,我們現在創建的這個Workbook()實例,它也是一個工作簿,我們要寫入內容的話是要寫進工作表裡面的,這就需要我們創建一個工作表,工作表名是’test1’。

使用的是Workbook下屬的add_sheet方法,add_sheet,新建工作表。

add_sheet(self, sheetname, cell_overwrite_ok=False)

需要注意的是,這個方法有兩個參數

· 第一個是sheetname,這個是工作表的名字,必須要設置的

· 另一個參數是cell_overwrite_ok,這個參數是覆寫的意思,默認是False,如果你現在要寫的單元格裡面,已經有內容了,就不能寫了,如果你要是寫的話會報錯的。當然,我們在使用的時候,最好是設置成True。也就是上面的那個寫法。這樣對同一個單元格寫入兩次的話就不會報錯了,當然,只會保留最後一次寫入的值。

接下來可以寫入信息了。

事實上,我們剛才使用add_sheet這個方法後,創建出了一個Worksheet類的實例。這個類有兩個方法是我們需要使用的,一個是write,另一個是write_merge。前者用來寫入一個單元格的內容,後者用來寫入一個合併單元格的內容。

我們先看write方法,裡面有四個參數,分別是r,c,label,style,

· r是行

· c是列

· label是內容

· style是格式

上面寫的 table.write(1,0,’number’) 是在第二行的第一列寫入’number’這個字符串。

同理,另外兩句分別是在第二行的第二列和第二行的第三列寫入’name’和’score’這兩個字符串。

write_merge是寫合併單元格的方法

· r1是最上面的單元格所在的行數

· r2是最下面的單元格所在的行數

· c1是最左面的單元格所在的列數

· c2是最右面的單元格所在的列數

· label是要寫入的內容

· style是格式

上面那個 table.write_merge(0,0,0,2,’Student information’) ,是把第0行的第一列,第二列,第三列的單元格合併了,在裡面寫入’Student information’這個字符串。

如果我們寫入信息的時候,不加style這個參數,那麼裡面的信息就是最普通的,沒有什麼格式,顏色啊,粗體啊,邊框啊,什麼的。

在xlwt3中,使用easyxf這個函數來設置單元格屬性。

比如這句當中,我們可以看到傳入了一個字符串作為參數:

‘font: bold on, italic on, name 宋體, height 400, color red; align: vert centre, horiz centre; borders: top THIN,left THIN,right THIN,bottom THIN’

分解來看,這個字符串有三部分:

我們剛才不是用

創建了一個單元格屬性嗎,紅色20號宋體,粗體,斜體,四周有邊框,居中。

寫入的使用加在作為style參數傳入。

這樣,我們就成功的設置單元格格式了。

接下來我們設置列寬。

使用這個方法就能設置列寬了,裡面的0代表第一列,列寬是20。我也不知道這個列寬是怎麼換算的,只要設置5293的話就是20,大家可以根據換算設置自己想要的列寬。

最後一步,保存我們建立的工作簿。

這裡面就一個參數,你要保存的excel表格的文件名。需要加路徑和後綴名的。需要注意的是,這個xlwt3隻能保存成.xls的excel文件。

打開我們保存的excel表格。

可以看到,工作表名是我們設置的test1,第一行的前三個單元格合併了,內容是’Student information’,紅色20號宋體,粗體,斜體,四周有邊框,居中。第二行分別是number,name,score。

以上就是創建這個excel表格的流程。

剛才上pypi發現,這個包好像就要被移除了,這樣的話以後用pip就無法安裝了。

xlwt3 0.1.2 : Python Package Index

以上就是關於xlwt3這個包的簡單教程。

值得收藏的Python第三方庫

網絡站點爬取

爬取網絡站點的庫Scrapy – 一個快速高級的屏幕爬取及網頁採集框架。cola – 一個分布式爬蟲框架。Demiurge – 基於PyQuery 的爬蟲微型框架。feedparser – 通用 feed 解析器。Grab – 站點爬取框架。MechanicalSoup – 用於自動和網絡站點交互的 Python 庫。portia – Scrapy 可視化爬取。pyspider – 一個強大的爬蟲系統。RoboBrowser – 一個簡單的,Python 風格的庫,用來瀏覽網站,而不需要一個獨立安裝的瀏覽器。

交互式解析器

交互式 Python 解析器。

IPython – 功能豐富的工具,非常有效的使用交互式 Python。

bpython- 界面豐富的 Python 解析器。

ptpython – 高級交互式Python解析器, 構建於python-prompt-toolkit 之上。

圖像處理

用來操作圖像的庫.

pillow – Pillow 是一個更加易用版的 PIL。

hmap – 圖像直方圖映射。

imgSeek – 一個使用視覺相似性搜索一組圖片集合的項目。

nude.py – 裸體檢測。

pyBarcode – 不藉助 PIL 庫在 Python 程序中生成條形碼。

pygram – 類似 Instagram 的圖像濾鏡。

python-qrcode – 一個純 Python 實現的二維碼生成器。

Quads – 基於四叉樹的計算機藝術。

scikit-image – 一個用於(科學)圖像處理的 Python 庫。

thumbor – 一個小型圖像服務,具有剪裁,尺寸重設和翻轉功能。

wand – MagickWand的Python 綁定。MagickWand 是 ImageMagick的 C API 。

HTTP

使用HTTP的庫。

requests – 人性化的HTTP請求庫。

grequests – requests 庫 + gevent ,用於異步 HTTP 請求.

httplib2 – 全面的 HTTP 客戶端庫。

treq – 類似 requests 的Python API 構建於 Twisted HTTP 客戶端之上。

urllib3 – 一個具有線程安全連接池,支持文件 post,清晰友好的 HTTP 庫。

數據庫

Python實現的數據庫。

pickleDB – 一個簡單,輕量級鍵值儲存數據庫。

PipelineDB – 流式 SQL 數據庫。

TinyDB – 一個微型的,面向文檔型數據庫。

ZODB – 一個 Python 原生對象數據庫。一個鍵值和對象圖數據庫。

Web 框架

全棧 web 框架。

Django – Python 界最流行的 web 框架。

awesome-django系列

Flask – 一個 Python 微型框架。

系列

Pyramid – 一個小巧,快速,接地氣的開源Python web 框架。

awesome-pyramid系列

Bottle – 一個快速小巧,輕量級的 WSGI 微型 web 框架。

CherryPy – 一個極簡的 Python web 框架,服從 HTTP/1.1 協議且具有WSGI 線程池。

TurboGears – 一個可以擴展為全棧解決方案的微型框架。

web.py – 一個 Python 的 web 框架,既簡單,又強大。

web2py – 一個全棧 web 框架和平台,專註於簡單易用。

Tornado – 一個web 框架和異步網絡庫。

HTML處理

處理 HTML和XML的庫。

BeautifulSoup – 以 Python 風格的方式來對 HTML 或 XML 進行迭代,搜索和修改。

bleach – 一個基於白名單的 HTML 清理和文本鏈接庫。

cssutils – 一個 Python 的 CSS 庫。

html5lib – 一個兼容標準的 HTML 文檔和片段解析及序列化庫。

lxml – 一個非常快速,簡單易用,功能齊全的庫,用來處理 HTML 和 XML。

MarkupSafe – 為Python 實現 XML/HTML/XHTML 標記安全字符串。

pyquery – 一個解析 HTML 的庫,類似 jQuery。

untangle – 將XML文檔轉換為Python對象,使其可以方便的訪問。

xhtml2pdf – HTML/CSS 轉 PDF 工具。

xmltodict – 像處理 JSON 一樣處理 XML。

遊戲開發

超贊的遊戲開發庫。

Cocos2d – cocos2d 是一個用來開發 2D 遊戲, 示例和其他圖形/交互應用的框架。基於 pyglet。

Panda3D – 由迪士尼開發的 3D 遊戲引擎,並由卡內基梅隴娛樂技術中心負責維護。使用C++編寫, 針對 Python 進行了完全的封裝。

Pygame – Pygame 是一組 Python 模塊,用來編寫遊戲。

PyOgre – Ogre 3D 渲染引擎的 Python 綁定,可以用來開發遊戲和仿真程序等任何 3D 應用。

PyOpenGL – OpenGL 的 Python 綁定及其相關 APIs。

PySDL2 – SDL2 庫的封裝,基於 ctypes。

RenPy – 一個視覺小說(visual novel)引擎。

python數據分析方向的第三方庫是什麼

Python除了有200個標準庫以外,還有10萬個第三方擴展庫,囊括了方方面面。其中做數據分析最常用到的庫有4個:

Numpy

Numpy是Python科學計算的基礎包。它除了為Python提供快速的數組處理能力,還是在算法和庫之間傳遞數據的容器。對於數值型數據,NumPy數組在存儲和處理數據時要比內置的 Python數據結構高效得多。此外,由低級語言(比如C和Fortran)編寫的庫可以直接操作NumPy 數組中的數據,無需進行任何數據複製工作。因此,許多Python的數值計算工具要麼使用NumPy 數組作為主要的數據結構,要麼可以與NumPy進行無縫交互操作。

Pandas

Pandas提供了快速便捷處理結構化數據的大量數據結構和函數,兼具NumPy高性能的數組計算功能以及電子表格和關係型數據庫(如SQL)靈活的數據處理功能。它提供了複雜精細的索引功能,能更加便捷地完成重塑、切片和切塊、聚合以及選取數據子集等操作。因為數據操作、準備、清洗是數據分析最重要的技能,所以Pandas也是學習的重點。

Matplotlib

Matplotlib是最流行的用於繪製圖表和其它二維數據可視化的Python庫,它非常適合創建出版物上用的圖表。雖然還有其它的Python可視化庫,但Matplotlib卻是使用最廣泛的,並且它和其它生態工具配合也非常完美。

Scikit-learn

Scikit-learn是Python的通用機器學習工具包。它的子模塊包括分類、回歸、聚類、降維、選型、預處理,對於Python成為高效數據科學編程語言起到了關鍵作用。

原創文章,作者:WXMA,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/134518.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
WXMA的頭像WXMA
上一篇 2024-10-04 00:06
下一篇 2024-10-04 00:06

相關推薦

  • Python周杰倫代碼用法介紹

    本文將從多個方面對Python周杰倫代碼進行詳細的闡述。 一、代碼介紹 from urllib.request import urlopen from bs4 import Bea…

    編程 2025-04-29
  • Python計算陽曆日期對應周幾

    本文介紹如何通過Python計算任意陽曆日期對應周幾。 一、獲取日期 獲取日期可以通過Python內置的模塊datetime實現,示例代碼如下: from datetime imp…

    編程 2025-04-29
  • Python列表中負數的個數

    Python列表是一個有序的集合,可以存儲多個不同類型的元素。而負數是指小於0的整數。在Python列表中,我們想要找到負數的個數,可以通過以下幾個方面進行實現。 一、使用循環遍歷…

    編程 2025-04-29
  • Python中引入上一級目錄中函數

    Python中經常需要調用其他文件夾中的模塊或函數,其中一個常見的操作是引入上一級目錄中的函數。在此,我們將從多個角度詳細解釋如何在Python中引入上一級目錄的函數。 一、加入環…

    編程 2025-04-29
  • 如何查看Anaconda中Python路徑

    對Anaconda中Python路徑即conda環境的查看進行詳細的闡述。 一、使用命令行查看 1、在Windows系統中,可以使用命令提示符(cmd)或者Anaconda Pro…

    編程 2025-04-29
  • python強行終止程序快捷鍵

    本文將從多個方面對python強行終止程序快捷鍵進行詳細闡述,並提供相應代碼示例。 一、Ctrl+C快捷鍵 Ctrl+C快捷鍵是在終端中經常用來強行終止運行的程序。當你在終端中運行…

    編程 2025-04-29
  • Python程序需要編譯才能執行

    Python 被廣泛應用於數據分析、人工智能、科學計算等領域,它的靈活性和簡單易學的性質使得越來越多的人喜歡使用 Python 進行編程。然而,在 Python 中程序執行的方式不…

    編程 2025-04-29
  • Python字典去重複工具

    使用Python語言編寫字典去重複工具,可幫助用戶快速去重複。 一、字典去重複工具的需求 在使用Python編寫程序時,我們經常需要處理數據文件,其中包含了大量的重複數據。為了方便…

    編程 2025-04-29
  • 蝴蝶優化算法Python版

    蝴蝶優化算法是一種基於仿生學的優化算法,模仿自然界中的蝴蝶進行搜索。它可以應用於多個領域的優化問題,包括數學優化、工程問題、機器學習等。本文將從多個方面對蝴蝶優化算法Python版…

    編程 2025-04-29
  • Python清華鏡像下載

    Python清華鏡像是一個高質量的Python開發資源鏡像站,提供了Python及其相關的開發工具、框架和文檔的下載服務。本文將從以下幾個方面對Python清華鏡像下載進行詳細的闡…

    編程 2025-04-29

發表回復

登錄後才能評論