製作壓縮包文件的方法:怎樣壓縮文件大小

一、壓縮介紹

現在這個時代電子信息發展迅猛,數據量越來越龐大,小米10手機攝像頭技術都達到1億像素;2021年9月,三星甚至提出2億像素的感測器技術。因此,壓縮數據成為數據存儲和傳輸中用於降低成本和時間的關鍵技術。

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

2億像素的ISOCELL HP1,5000萬像素的ISOCELL GN5

壓縮技術又分為有損壓縮與無損壓縮兩類,兩者的主要區別是:有損壓縮還原時跟原始信息不是完全一樣,但是不影響使用,比如音頻、圖片、視頻類信息;無損壓縮還原時跟原始信息完全一樣,比如本文要介紹的常用壓縮軟體RAR,Zip等壓縮方法。

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

Windows下比較熟知的壓縮方法有zip或者RAR,為了便於壓縮與解壓的使用,開發了許多的解壓縮軟體,比如:winrar、好壓、快壓、360壓縮等。但是在Linux比較常用的壓縮方法卻是gzip、bzip2、compress等,比如官方下載的gcc編譯器源碼壓縮文件就是基於gzip壓縮的:gcc-11.2.0.tar.gz。

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

打包或者壓縮格式很多,目前主流使用的有如下表所示幾種:

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

表一

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

表二

對於表二類似「xxx.tar.gz」等格式的文件,是Linux下的一種文件格式,生成該格式文件分為兩個步驟,(1)、xxx文件打包為xxx.tar;(2)、xxx.tar壓縮為xxx.tar.gz。下面大概介紹Linux下tar打包與gz、bz2等壓縮工具的使用。

二、Linux打包tar

由於Linux中的很多壓縮程序只能針對一個文件進行壓縮,因此如果包含許多文件,則需要將所有文件打包為一個文件,然後再壓縮。

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

Linux下最常用的打包程序就是tar,使用tar程序打出來的包我們常稱為tar包,tar包文件的擴展名通常是.tar。生成tar包後,就可以用其它的程序(gzip或bzip2等)來進行壓縮了。

2.1、tar文件結構

Tar指令只用於多文件打包,並不壓縮文件,因此打包後的文件並沒有減小,反而由於在打包時會在每個文件頭加入512位元組的tar頭部信息,使得打包後的文件略微變大。比如當前有文件a1.c、a2.c、a3.c,每個文件100k,打包後文件的文件結構如下圖所示:

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

如上圖所示,3個文件共300k,通過tar打包後,至少為301.5k;因為tar文件是按塊存儲,每個塊為512bytes大小,所以tar文件大小應該為512位元組的倍數,如果a1.c文件大小為99.7k,則通過tar打包時,最後0.3k必須填充為0,補足至100k(滿足512位元組的倍數)。

2.2、tar_header頭部結構

tar_header為512位元組的塊結構,保存後面的文件信息,tar源碼的tar.h文件中該header結構如下圖所示,該header結構剛好是一個塊大小,即512位元組每個塊。

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

tar源碼版本為「tar-1.26.tar.gz」,可通過以下網盤鏈接下載:

鏈接:
https://pan.baidu.com/s/1T34dYxBRWKYE8jmFvv_2aw

提取碼:ppw2

tar打包函數入口為create_archive(),在源碼文件create.c中。

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

2.3、tar命令打包

tar 命令用於打包操作時,該命令的基本格式為:tar [選項] 源文件或目錄。tar命令常用的選項及各自的含義如下圖所示。

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

(1)、創建2個文件a1.txt、a2.txt,分別輸入如下內容:

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

(2)、tar命令進行打包,生成aTar.tar打包文件

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

2.4、aTar.tar文件內容分析

通過UltraEdit打開上面tar命令打包生成的aTar.tar文件,可以看到aTar.tar文件格式為:首先是a1.txt的tar_header信息,然後是a1.txt的內容;接著是a2.txt的tar_header信息,然後是a2txt的內容。

(1)、第一塊:從地址0x00000000h位置到0x00000200h之間(共512位元組)是a1.txt的tar_header信息:

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

根據如上結構struct posix_header結構體的定義,說明幾個欄位含義:

a>、最開始的位置存儲name,大小為100位元組,內容為61 31 2E 74 78 74 00,即為「a1.txt」;

b>、後面是mode欄位內容為30 30 30 30 36 34 34 00,即為「0000644」,表示a1.txt文件的操作許可權,與ls命令查詢a1.txt文件許可權一致。

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

c>、uid、gid信息,即當前linux登錄用戶id與組id,這兩個id的內容均為30 30 30 31 37 35 30 00,即為「0001750」,該值為八進位,轉為十進位為1000,與id命令查詢的結果一致。

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

d>、size欄位值為30 30 30 30 30 30 30 30 30 33 33 00,即為「00000000033」,該值為八進位,轉為十進位為27,表示a1.txt文件大小為27位元組,與文件內容大小一致:

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

e>、magic欄位值為75 73 74 61 72 20,即為「ustar」,表示當前包為tar文件;

f>、uname與gname為當前linux登錄用戶名與組名,即kevin。

(2)、第二塊:從地址0x00000200h位置到0x00000400h之間(共512位元組)是a1.txt的內容,雖然a1.txt的內容為27位元組,但是塊大小為512,不足地方補0。

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

(3)、第三塊:從地址0x00000400h位置到0x00000600h之間(共512位元組)是a2.txt的tar_header信息:

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

a2.txt的tar_header信息格式與a1.txt的tar_header一致,其size欄位為「00000000025」,轉為十進位為21,表示a2.txt內容為21個字元,確認一致。

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

(4)、第四塊:從地址0x00000600h位置到0x00000800h之間(共512位元組)是a2.txt的內容,雖然a2.txt的內容為21位元組,但是塊大小為512,不足地方補0。

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

註:以上與「2.1、tar文件的結構一致」!!!

三、Linux壓縮至gz、bz2、z格式

Linux下文件壓縮屬於無損壓縮,解壓縮還原時必須和原文件一致,否則會導致程序運行錯誤;其基本原理為,通過查找文件內的重複位元組,建立一個相同位元組的詞典文件,並用一個代碼表示。比如如下文件:

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

重複的字元串「小扇子的筆記」可以用一個代碼「a」表示,則文件內容可以表示為:

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

這文件的大小就縮小了,還原回來也是無信息損失的。

當然壓縮演算法遠比這個複雜,Linux下的壓縮工具常用的有GNU組織開發的gzip(.gz)、壓縮能力更強的bzip2(.bz2)、比較古老的壓縮指令compress(.Z)、以及最新的提供最佳壓縮率的XZ(.xz)。

這些壓縮命令只能用來壓縮文件,不能壓縮目錄,即便指定了目錄,也只能壓縮目錄內的所有文件;同時只能壓縮單個文件,因此通常與tar打包命令一起使用,在tar打包命令中加入如下選項即可調用對應的壓縮命令進行壓縮:

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

3.1、gzip壓縮

在tar指令中加入『-z』選項,調用gzip進行壓縮。

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

解壓縮命令為:tar –xzf a.tar.gz。

3.2、bzip2壓縮

在tar指令中加入『-j』選項,調用bzip2進行壓縮。

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

解壓縮命令為:tar –xjf a.tar.bz2。

3.3、xz壓縮

在tar指令中加入『-J』選項,調用xz進行壓縮。

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

解壓縮命令為:tar –xJf a.tar.xz。

3.4、compress壓縮

現在新的Linux系統都沒有安裝ncompress壓縮工具,需要先安裝:

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

然後在tar指令中加入『-Z』選項,調用compress進行壓縮。

一文了解Linux下tar打包過程,及調用gzip、bzip2進行壓縮的方法

解壓縮命令為:tar –xZf a.tar.Z。

3.5、其他壓縮工具

Windows下常用的壓縮格式zip與rar在Linux下也是支持的。

(1)、Linux下提供了zip和unzip程序,zip是壓縮程序,unzip是解壓程序;

(2)、linux下處理.rar文件,需要安裝RAR for Linux,如下指令:
  # tar -xzpvf rarlinux-3.2.0.tar.gz
  # cd rar
  # make
  安裝後有rar和unrar這兩個程序,rar是壓縮程序,unrar是解壓程序。

原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/211712.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
投稿專員的頭像投稿專員
上一篇 2024-12-08 16:40
下一篇 2024-12-08 16:40

相關推薦

發表回復

登錄後才能評論