常見文件頭詳解

一、常見文件頭格式

在計算機中,文件頭是一段用來描述文件內容和格式的數據。不同的文件格式有不同的文件頭格式。文件頭通常包含文件的類型、版本、編碼方式、文件大小等信息,以方便計算機識別和處理文件。

常見的文件頭格式有文本文件、二進位文件、音頻文件、圖片文件、視頻文件等,其中文本文件由於其文件內容的簡單性,一般沒有特定的文件頭格式。

二、常用文件頭

以下是一些常見的文件頭:

    文件類型             文件頭

    BMP 圖片文件      424D
    GIF 圖片文件      474946383961 or 474946383761
    JPG 圖片文件      FFD8 or FFE0
    MP3 音頻文件      FFFB
    AVI 視頻文件      52494646
    ZIP 壓縮文件      504B0304
    PDF 文檔文件      255044462D312E

三、常見文件頭值

文件頭值是指不同類型文件所對應的文件頭十六進位值。常見的文件頭值包括:

    文件類型             文件頭

    BMP 圖片文件      42 4D
    GIF 圖片文件      47 49 46 38 39 61 or 47 49 46 38 37 61
    JPG 圖片文件      FF D8 or FF E0
    MP3 音頻文件      FF FB
    AVI 視頻文件      52 49 46 46
    ZIP 壓縮文件      50 4B 03 04
    PDF 文檔文件      25 50 44 46 2D 31 2E

四、常見文件圖標

不同的文件類型在計算機中有不同的圖標表示。常見的文件圖標如下:

    文件類型            文件圖標

    圖片文件             圖片圖標
    音頻文件             聲音圖標
    視頻文件             視頻圖標
    壓縮文件             文件夾加鎖圖標
    文檔文件             文檔圖標

五、常見文件頭編碼

不同的文件類型需要採用不同的編碼方式來存儲文件頭信息。常見的編碼方式有ASCII碼、Unicode碼、UTF8碼等。其中,ASCII碼是一種用於計算機處理的編碼方式,通常用一個位元組(8位二進位數)表示一個字元,比較節省存儲空間。

六、常見文件頭文件尾

與文件頭相對應的是文件尾,也就是文件的結尾標識。文件尾用來標示文件的結束,不同的文件類型也採用不同的文件尾格式。例如: JPEG、PDF等文件格式在文件末尾都有特定的結束標識。

七、常見文件頭格式excel

Excel的文件頭一般是採用二進位格式進行存儲的。由於Excel文件包含多個Sheet,因此文件頭也需要記錄Sheet的相關信息。在Excel文件中,文件頭的大小為8位元組,其中第7-8位元組是一個長整數,表示Sheet的數量,即一個Excel文件最多包含多少個Sheet。

八、十六進位常見文件頭

十六進位是指一種用16個字元(0~9、A~F)表示數字的計數法。常見的文件頭格式通常以十六進位數的形式呈現。以下是一些常見文件類型的十六進位文件頭:

    文件類型             文件頭

    BMP 圖片文件      42 4D
    GIF 圖片文件      47 49 46 38 39 61 or 47 49 46 38 37 61
    JPG 圖片文件      FF D8 FF E0 or FF D8 FF E1
    MP3 音頻文件      FF FB
    AVI 視頻文件      52 49 46 46
    ZIP 壓縮文件      50 4B 03 04
    PDF 文檔文件      25 50 44 46 2D 31 2E

九、常見視頻文件

視頻文件在計算機中也有著廣泛的運用,以下是一些常見的視頻文件類型及其文件頭:

    文件類型             文件頭

    AVI              52 49 46 46
    FLV              46 4C 56 01
    MP4              00 00 00 18 66 74 79 70 69 73 6F 6D
    WMV              30 26 B2 75 8E 66 CF 11 A6 D9 00 AA 00 62 CE 6C

十、文件頭格式標準選取

文件頭格式標準是指為不同文件類型設置統一的文件頭格式,以方便計算機進行文件識別。什麼樣的文件頭格式標準是合適的呢?通常應考慮以下因素:

  • 文件頭格式應盡量短小,節省存儲空間
  • 文件頭格式應盡量規範化,方便計算機處理
  • 文件頭格式應足夠複雜,在保障一定唯一性的同時,也提高了計算機的識別準確度

綜合以上幾點因素,可以選取較短的、符合規範的、複雜的文件頭格式進行標準化。例如,BMP圖片文件的文件頭格式為「424D」;MP3音頻文件的文件頭格式為「FFFB」。

以下是一個Python編寫的文件識別函數實例,可以通過該函數來識別文件的類型:

import binascii

def get_file_type(file_path):
    with open(file_path, 'rb') as f:
        head = f.read(4)
        filetype = ''
        if head.hex() == "89504e47":
            filetype = 'PNG'
        elif head.hex() == '47494638':
            filetype = 'GIF'
        elif head.hex() == '49492A00' or head.hex() == '4D4D002A':
            filetype = 'TIFF'
        elif head.hex() == 'FFD8FFDB' or head.hex() == 'FFD8FFE0':
            filetype = 'JPEG'
        elif head.hex() == '49534103':
            filetype = 'MP3'
        elif head.hex() == '52494646':
            next_four = f.read(4)
            if next_four == b'\x57\x41\x56\x45' or next_four == b'\x41\x56\x49\x20':
                filetype = 'AVI'
            else:
                filetype = 'WAV'
        elif head.hex() == '52494646':
            filetype = 'WMA'
        elif head.hex() == '3026B2758E66CF11':
            filetype = 'WMV'
        else:
            filetype = 'Unkown type'
        return filetype

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/189445.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-11-29 08:03
下一篇 2024-11-29 08:03

相關推薦

  • vue下載無後綴名的文件被加上後綴.txt,有後綴名的文件下載正常問題的解決

    本文旨在解決vue下載無後綴名的文件被加上後綴.txt,有後綴名的文件下載正常的問題,提供完整的代碼示例供參考。 一、分析問題 首先,需了解vue中下載文件的情況。一般情況下,我們…

    編程 2025-04-29
  • 如何在Java中拼接OBJ格式的文件並生成完整的圖像

    OBJ格式是一種用於表示3D對象的標準格式,通常由一組頂點、面和紋理映射坐標組成。在本文中,我們將討論如何將多個OBJ文件拼接在一起,生成一個完整的3D模型。 一、讀取OBJ文件 …

    編程 2025-04-29
  • 為什麼用cmd運行Java時需要在文件內打開cmd為中心

    在Java開發中,我們經常會使用cmd在命令行窗口運行程序。然而,有時候我們會發現,在運行Java程序時,需要在文件內打開cmd為中心,這讓很多開發者感到疑惑,那麼,為什麼會出現這…

    編程 2025-04-29
  • Python程序文件的拓展

    Python是一門功能豐富、易於學習、可讀性高的編程語言。Python程序文件通常以.py為文件拓展名,被廣泛應用於各種領域,包括Web開發、機器學習、科學計算等。為了更好地發揮P…

    編程 2025-04-29
  • Python中讀入csv文件數據的方法用法介紹

    csv是一種常見的數據格式,通常用於存儲小型數據集。Python作為一種廣泛流行的編程語言,內置了許多操作csv文件的庫。本文將從多個方面詳細介紹Python讀入csv文件的方法。…

    編程 2025-04-29
  • Python將矩陣存為CSV文件

    CSV文件是一種通用的文件格式,在統計學和計算機科學中非常常見,一些數據分析工具如Microsoft Excel,Google Sheets等都支持讀取CSV文件。Python內置…

    編程 2025-04-29
  • Python zipfile解壓文件亂碼處理

    本文主要介紹如何在Python中使用zipfile進行文件解壓的處理,同時詳細討論在解壓文件時可能出現的亂碼問題的各種解決辦法。 一、zipfile解壓文件亂碼問題的根本原因 在P…

    編程 2025-04-29
  • Python如何導入py文件

    Python是一種開源的高級編程語言,因其易學易用和強大的生態系統而備受青睞。Python的import語句可以幫助用戶將一個模塊中的代碼導入到另一個模塊中,從而實現代碼的重用。本…

    編程 2025-04-29
  • Python合併多個相同表頭文件

    對於需要合併多個相同表頭文件的情況,我們可以使用Python來實現快速的合併。 一、讀取CSV文件 使用Python中的csv庫讀取CSV文件。 import csv with o…

    編程 2025-04-29
  • Python寫文件a

    Python語言是一種功能強大、易於學習、通用並且高級編程語言,它具有許多優點,其中之一就是能夠輕鬆地進行文件操作。文件操作在各種編程中都佔有重要的位置,Python作為開發人員常…

    編程 2025-04-29

發表回復

登錄後才能評論