使用python壓縮文件的簡單介紹

本文目錄一覽:

python中的zipfile?

python中的zipfile模塊是用於解壓/壓縮zip文件的,壓縮a.txt為a.zip,從b.zip解壓出b.txt(假設它們都放在d:\,且b.zip中只有b.txt)示範代碼如下5行:

from os import chdir;

from zipfile import ZipFile;

chdir(“d:/”);

with Zipfile(“d:/b.zip”,”r”) as zipf:zipf.extractall();

with Zipfile(“d:/a.zip”,”w”) as zipf:zipf.write(“d:/a.txt”);

Python打開zip文件

    Zip文件格式是通用的文檔壓縮標準。自1.6版本起,Python中zipfile模塊能夠直接處理zip文件里的數據,例如需要將對應目錄或多個文件打包或壓縮成zip格式,或者需要查看一個zip格式的歸檔文件中部分或者所有文件同時避免講這些文件展開到磁盤上。使用ZipFile類來操作zip文件。

創建一個ZipFile對象,表示一個zip文件。

     參數file:文件的路徑或者類似文件對象

     參數mode:讀”r”,寫入”w”,添加”a”

     參數compression: ZIP_STORED(無壓縮),ZIP_DEFLATED(壓縮,需要zlib支持)

     參數allowZip64:默認情況下報錯,將其設為True,ZipFile將用ZIP64擴展進行創建文件。

下面示例演示了讀取一個zip文檔,將文檔里所有文件解壓到名為”work”的文件里。

import zipfile

if __name__ == “__main__”:

    zFile = zipfile.ZipFile(“F:\\txt.zip”,”r”)

    #ZipFile.namelist():獲取ZIP文檔內所有文件的名稱列表

    for fileM in zFile.namelist():

        zFile.extract(fileM,”F:\\work”)

        zFile.close()

read(self,name,pwd=None)獲取ZIP文檔內文件的二進制數據

下面例子演示了使用read方法獲取ZIP文檔中mango.txt文件的數據,並寫到copy.txt文件中

import zipfile 

if __name__ == “__main__”:

    zipFile = zipfile.ZipFile(‘F:\\test.zip’,’r’)

    data = zipFile.read(“mango.txt”)

    (lambda f,d:(f.write(d),f.close()))(open(“F:\\copy.txt,’w”),data)

    zipFile.close()

write(self, filename, arcname=None, compress_type=None)將指定文件寫入ZIP文檔中

     參數filename:需要寫入文件的路徑

     參數arcname:文件寫入ZIP文檔後保存的文件名

     參數compress_type:壓縮方法(ZIP_STORED或ZIP_DEFAULED)

下面離子演示了創建一個zip文檔,將test.docx文件寫入壓縮文檔裡面。

import zipfile

if __name__ == “__main__”:

    zipFile = zipfile.ZipFile(“F:\\test.zip”,”w”)

    zipFile.write(“F:\\test.docx”,”ok.docx”,zipfile.ZIP_DEFLATED)

    zipFile.close()

getinfo(name)返回一個ZipInfo類的對象。

import zipfile

if __name__ == “__main__”:

    zipInfo = zipFile.getinfo(ok.docx)

    print(“filename:”,zipInfo.filename)

    print(“date_time:”,zipInfo.date_time)

常用函數

關閉歸檔文件,你必須在退出程序之前調用close()否則將不會寫入關鍵記錄數據。

返回一個ZipInfo對象,其中包含有關歸檔成員name的信息。針對一個目前並不包含于歸檔中的名稱調用getinfo()將會引發KeyError。

   返回一個列表,其中包含每個歸檔成員的ZipInfo對象。如果是打開一個現有歸檔則這些對象的排列順序與他們對於條目在磁盤上的實際ZIP文件中的順序一致。

返回按名稱排列的歸檔成員列表。

以二進制文件類對象的形式訪一個歸檔成員。name可以是歸檔內某個文件的名稱也可以是某個ZipInfo對象。如果包含了mode形參,則它必須為”r”(默認值)或”w”。pwd為用於解密已加密Zip文件的密碼。

open()也是一個上下文 管理器,因此支持with語句:

with ZipFile(‘spam.zip’) as myzip:

    with myzip.open(‘eggs.txt’) as myfile:

    print(myfile.read())

如果mode為“r”則文件類對象(ZipExtFile)將只讀並且提供下列方法:read(),readline(),readlines(),seek(),tell(),__iter__(),__next__()。這些對象可獨立於ZipFile進行操作。

如果mode=’w’則返回一個可寫入的文件句柄,它將支持write()方法。當一個可寫入的文件句柄被打開時,嘗試讀寫ZIP文件中的其他文件將會引發ValueError。

當寫入一個文件時,如果文件大小不能預先確定但是可能超過2GiB,可傳入force_zip64=True以確保標頭格式能夠支持超大文件。如果文件大小可以預先確定,則在構造ZipInfo對象時應設置file_size,並將其作name形參。

從歸檔中提取一個成員放入當前工作目錄;member必須為成員的完整名稱或ZipInfo對象。成員的文件信息會儘可能精確地被提取。path指定一個要提取到的不同目錄。member可以是一個文件名或ZipInfo對象。pwd是用於解密文件的密碼。返回所創建的經正規化的路徑(對應於目錄或新文件)。

從歸檔中提取出所有成員放入當前工作目錄。path指定一個要提取到的不同的目錄。members為可選項且必須為namelist()所返回列表的一個子集。pwd是用於解密文件的密碼。

警告:絕不要未經預先檢驗就從不可靠的源中提取歸檔文件。 這樣有可能在  path  之外創建文件,例如某些成員具有以 “/” 開始的文件名或帶有兩個點號 “..” 的文件名。 此模塊會嘗試防止這種情況。 參見  extract()  的注釋。

將歸檔是目錄表打印到sys.stdout.

設置pwd為用於提取已加密文件的默認密碼。

返回歸檔中文件name的字節數據。name是歸檔中文件的名稱,或是一個ZipInfo對象。歸檔必須以讀取或追加方式打開。pwd為用於已加密文件的密碼,並且如果指定該參數則它將覆蓋通過setpassword()設置的默認密碼。 on a ZipFile that uses a compression method 在使用  ZIP_STORED  ,  ZIP_DEFLATED ,  ZIP_BZIP2  或  ZIP_LZMA  以外的壓縮方法的 ZipFile 上調用  read()  將引發  NotImplementedError 。 如果相應的壓縮模塊不可用也會引發錯誤。

讀取歸檔中的所有文件並檢查他們的CRC和文件頭。返回第一個已損壞文件的名稱,在其他情況下則返回None。

將名為filename的文件寫入歸檔,給予的歸檔名為arcname(默認情況下將與filename一致,但是不帶驅動器盤符並會移除開頭的路徑分隔符)。compress_type如果給出,它將覆蓋作為構造器compression形參對於新條目所給出的值。類似地,compresslevel如果給出也將覆蓋構造器。歸檔必須使用”w”,”x“或”a”模式打開。

將一個文件寫入歸檔。 內容為  data ,它可以是一個  str  或  bytes  的實例;如果是  str ,則會先使用 UTF-8 進行編碼。  zinfo_or_arcname  可以是它在歸檔中將被給予的名稱,或者是  ZipInfo  的實例。 如果它是一個實例,則至少必須給定文件名、日期和時間。 如果它是一個名稱,則日期和時間會被設為當前日期和時間。 歸檔必須以 ‘w’, ‘x’ 或 ‘a’ 模式打開。

ZIP文件的名稱

用python解壓圖片並打印代碼

import zipfile

# 傳入壓縮文件zfile.zip獲取相關信息

zip_file = zipfile.ZipFile(‘zfile.zip’)

# 獲取壓縮文件中的內容

f_content = zip_file.namelist()

# 壓縮前的大小

f_size = zip_file.getinfo(‘zfile/a.txt’).file_size

# 壓縮後的大小

c_size = zip_file.getinfo(‘zfile/a.txt’).compress_size

ZipFile 對象有一個 namelist()方法,返回 ZIP 文件中包含的所有文件和文件夾 的字符串的列表。這些字符串可以傳遞給 ZipFile 對象的 getinfo()方法,返回一個關 於特定文件的 ZipInfo 對象。ZipInfo 對象有自己的屬性,諸如表示字節數的 file_size 和 compress_size,它們分別表示原來文件大小和壓縮後文件大小。ZipFile 對象表示 整個歸檔文件,而 ZipInfo 對象則保存該歸檔文件中每個文件的有用信息。

從 ZIP 文件中解壓縮

ZipFile 對象的 extractall()方法從 ZIP 文件中解壓縮所有文件和文件夾,放到當 前工作目錄中。

import zipfile

zip_file = zipfile.ZipFile(‘zfile.zip’)

# 解壓

zip_extract = zip_file.extractall()

zip_extract.close()

運行這段代碼後, example.zip 的內容將被解壓縮到 C:\。 或者, 你可以向 extractall()傳遞的一個文件夾名稱,它將文件解壓縮到那個文件夾,而不是當前工作 目錄。如果傳遞給 extractall()方法的文件夾不存在,它會被創建。例如,如果你用 exampleZip.extractall(‘C:\ delicious’)取代處的調用,代碼就會從 example.zip 中解壓 縮文件,放到新創建的 C:\delicious 文件夾中。

ZipFile 對象的 extract()方法從 ZIP 文件中解壓縮單個文件。

創建和添加到 ZIP 文件

要創建你自己的壓縮 ZIP 文件,必須以“寫模式”打開 ZipFile 對象,即傳入’w’ 作為第二個參數(這類似於向 open()函數傳入’w’,以寫模式打開一個文本文件)。

如果向 ZipFile 對象的 write()方法傳入一個路徑,Python 就會壓縮該路徑所指 的文件,將它加到 ZIP 文件中。write()方法的第一個參數是一個字符串,代表要添 加的文件名。第二個參數是“壓縮類型”參數,它告訴計算機使用怎樣的算法來壓 縮文件。可以總是將這個值設置為 zipfile.ZIP_DEFLATED(這指定了 deflate 壓縮 算法,它對各種類型的數據都很有效)。

import zipfile

zip_file = zipfile.ZipFile(‘new.zip’,’w’)

# 把zfile整個目錄下所有內容,壓縮為new.zip文件

zip_file.write(‘zfile’,compress_type=zipfile.ZIP_DEFLATED)

# 把c.txt文件壓縮成一個壓縮文件

# zip_file.write(‘c.txt’,compress_type=zipfile.ZIP_DEFLATED)

zip_file.close()

這段代碼將創建一個新的 ZIP 文件,名為 new.zip,它包含 spam.txt 壓縮後的內容。

要記住,就像寫入文件一樣,寫模式將擦除 ZIP 文件中所有原有的內容。如果 只是希望將文件添加到原有的 ZIP 文件中,就要向 zipfile.ZipFile()傳入’a’作為第二 個參數,以追加模式打開 ZIP 文件。

怎麼壓縮用python寫的遊戲的文件大小?或者用什麼開發庫?

你可以嘗試以下方法:

建立虛擬環境,減少Python打包額外的第三方庫

使用upx和pyinstaller進行壓縮

使用upx和nuitka進行壓縮

這幾種方法網上可以找到很多教程,都能夠在一定程度上減小打包出來的文件大小,但是因為Python的解釋型語言,除了使用nuitka編譯成exe以外,其它的壓縮方法作用一般不大,但是使用nuitka編譯後的文件也會有較大的體積。

Python實現批量壓縮文件/文件夾——zipfile

zipfile是python里用來做zip格式編碼的壓縮和解壓縮的,由於是很常見的zip格式,所以這個模塊使用頻率也是比較高的,

在這裡對zipfile的使用方法做一些記錄。即方便自己也方便別人。

Python zipfile模塊用來做zip格式編碼的壓縮和解壓縮的,要進行相關操作,首先需要實例化一個 ZipFile 對象。ZipFile 接受一個字符串格式壓縮包名稱作為它的必選參數,第二個參數為可選參數,表示打開模式,類似於文件操作,有r/w/a三種模式,分別代表讀、寫、添加,默認為r,即讀模式。

zipfile里有兩個非常重要的class, 分別是ZipFile和ZipInfo, 在絕大多數的情況下,我們只需要使用這兩個class就可以了。ZipFile是主要的類,用來創建和讀取zip文件而ZipInfo是存儲的zip文件的每個文件的信息的。

ZipFile還提供了如下常用的方法和屬性:

獲取zip文檔內指定文件的信息。返回一個zipfile.ZipInfo對象,它包括文件的詳細信息。

獲取zip文檔內所有文件的信息,返回一個zipfile.ZipInfo的列表。

獲取zip文檔內所有文件的名稱列表。

將zip文檔內的指定文件解壓到當前目錄。參數member指定要解壓的文件名稱或對應的ZipInfo對象;參數path指定了解析文件保存的文件夾;

解壓zip文檔中的所有文件到當前目錄。參數members的默認值為zip文檔內的所有文件名稱列表,也可以自己設置,選擇要解壓的文件名稱。

將zip文檔內的信息打印到控制台上。

設置zip文檔的密碼。

python怎樣壓縮和解壓縮ZIP文件

有時我們需要在 Python 中使用 zip 文件,而在1.6版中,Python 就已經提供了 zipfile 模塊可以進行這樣的操作。不過 Python 中的 zipfile 模塊不能處理多卷的情況,不過這種情況並不多見,因此在通常情況下已經足夠使用了。下面我只是對一些基本的 zipfile 操作進行了記錄,足以應付大部分的情況了。

zipfile 模塊可以讓你打開或寫入一個 zip 文件。比如:

import zipfile

z = zipfile.ZipFile(‘zipfilename’, mode=’r’)

這樣就打開了一個 zip 文件,如果mode為’w’或’a’則表示要寫入一個 zip 文件。如果是寫入,則還可以跟上第三個參數:

compression=zipfile.ZIP_DEFLATED 或

compression=zipfile.ZIP_STORED ZIP_DEFLATED是壓縮標誌,如果使用它需要編譯了zlib模塊。而後一個只是用zip進行打包,並不壓縮。

在打開了zip文件之後就可以根據需要是讀出zip文件的內容還是將內容保存到 zip 文件中。

讀出zip中的內容

很簡單,zipfile 對象提供了一個read(name)的方法。name為 zip文件中的一個文件入口,執行完成之後,將返回讀出的內容,你把它保存到想到的文件中即可。

寫入zip文件

有兩種方式,一種是直接寫入一個已經存在的文件,另一種是寫入一個字符串。

對 於第一種使用 zipfile 對象的 write(filename, arcname, compress_type),後兩個參數是可以忽略的。第一個參數是文件名,第二個參數是表示在 zip 文件中的名字,如果沒有給出,表示使用與filename一樣的名字。compress_type是壓縮標誌,它可以覆蓋創建 zipfile 時的參數。第二種是使用 zipfile 對象的 writestr(zinfo_or_arcname, bytes),第一個參數是zipinfo 對象或寫到壓縮文件中的壓縮名,第二個參數是字符串。使用這個方法可以動態的組織文件的內容。

需要注意的是在讀出時,因為只能讀出內容,因此如果想實現按目錄結構展開 zip 文件的話,這些操作需要自已來完成,比如創建目錄,創建文件並寫入。而寫入時,則可以根據需要動態組織在 zip 文件中的目錄結構,這樣可以不按照原來的目錄結構來生成 zip 文件。

於是我為了方便使用,創建了自已的一個 ZFile 類,主要是實現象 winrar 的右鍵菜單中的壓縮到的功能–即將一個zip文件壓縮到指定目錄,自動創建相應的子目錄。再有就是方便生成 zip 文件。類源碼為:

# coding:cp936

# Zfile.py

# xxteach.com

import zipfile

import os.path

import os

class ZFile(object):

def __init__(self, filename, mode=’r’, basedir=”):

self.filename = filename

self.mode = mode

if self.mode in (‘w’, ‘a’):

self.zfile = zipfile.ZipFile(filename, self.mode, compression=zipfile.ZIP_DEFLATED)

else:

self.zfile = zipfile.ZipFile(filename, self.mode)

self.basedir = basedir

if not self.basedir:

self.basedir = os.path.dirname(filename)

def addfile(self, path, arcname=None):

path = path.replace(‘//’, ‘/’)

if not arcname:

if path.startswith(self.basedir):

arcname = path[len(self.basedir):]

else:

arcname = ”

self.zfile.write(path, arcname)

def addfiles(self, paths):

for path in paths:

if isinstance(path, tuple):

self.addfile(*path)

else:

self.addfile(path)

def close(self):

self.zfile.close()

def extract_to(self, path):

for p in self.zfile.namelist():

self.extract(p, path)

def extract(self, filename, path):

if not filename.endswith(‘/’):

f = os.path.join(path, filename)

dir = os.path.dirname(f)

if not os.path.exists(dir):

os.makedirs(dir)

file(f, ‘wb’).write(self.zfile.read(filename))

def create(zfile, files):

z = ZFile(zfile, ‘w’)

z.addfiles(files)

z.close()

def extract(zfile, path):

z = ZFile(zfile)

z.extract_to(path)

z.close()

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/239053.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-12-12 12:14
下一篇 2024-12-12 12:14

相關推薦

  • Python中引入上一級目錄中函數

    Python中經常需要調用其他文件夾中的模塊或函數,其中一個常見的操作是引入上一級目錄中的函數。在此,我們將從多個角度詳細解釋如何在Python中引入上一級目錄的函數。 一、加入環…

    編程 2025-04-29
  • Python周杰倫代碼用法介紹

    本文將從多個方面對Python周杰倫代碼進行詳細的闡述。 一、代碼介紹 from urllib.request import urlopen from bs4 import Bea…

    編程 2025-04-29
  • 如何查看Anaconda中Python路徑

    對Anaconda中Python路徑即conda環境的查看進行詳細的闡述。 一、使用命令行查看 1、在Windows系統中,可以使用命令提示符(cmd)或者Anaconda Pro…

    編程 2025-04-29
  • Python列表中負數的個數

    Python列表是一個有序的集合,可以存儲多個不同類型的元素。而負數是指小於0的整數。在Python列表中,我們想要找到負數的個數,可以通過以下幾個方面進行實現。 一、使用循環遍歷…

    編程 2025-04-29
  • Python計算陽曆日期對應周幾

    本文介紹如何通過Python計算任意陽曆日期對應周幾。 一、獲取日期 獲取日期可以通過Python內置的模塊datetime實現,示例代碼如下: from datetime imp…

    編程 2025-04-29
  • Python程序需要編譯才能執行

    Python 被廣泛應用於數據分析、人工智能、科學計算等領域,它的靈活性和簡單易學的性質使得越來越多的人喜歡使用 Python 進行編程。然而,在 Python 中程序執行的方式不…

    編程 2025-04-29
  • Python清華鏡像下載

    Python清華鏡像是一個高質量的Python開發資源鏡像站,提供了Python及其相關的開發工具、框架和文檔的下載服務。本文將從以下幾個方面對Python清華鏡像下載進行詳細的闡…

    編程 2025-04-29
  • Python字典去重複工具

    使用Python語言編寫字典去重複工具,可幫助用戶快速去重複。 一、字典去重複工具的需求 在使用Python編寫程序時,我們經常需要處理數據文件,其中包含了大量的重複數據。為了方便…

    編程 2025-04-29
  • 蝴蝶優化算法Python版

    蝴蝶優化算法是一種基於仿生學的優化算法,模仿自然界中的蝴蝶進行搜索。它可以應用於多個領域的優化問題,包括數學優化、工程問題、機器學習等。本文將從多個方面對蝴蝶優化算法Python版…

    編程 2025-04-29
  • python強行終止程序快捷鍵

    本文將從多個方面對python強行終止程序快捷鍵進行詳細闡述,並提供相應代碼示例。 一、Ctrl+C快捷鍵 Ctrl+C快捷鍵是在終端中經常用來強行終止運行的程序。當你在終端中運行…

    編程 2025-04-29

發表回復

登錄後才能評論