常见文件头详解

一、常见文件头格式

在计算机中,文件头是一段用来描述文件内容和格式的数据。不同的文件格式有不同的文件头格式。文件头通常包含文件的类型、版本、编码方式、文件大小等信息,以方便计算机识别和处理文件。

常见的文件头格式有文本文件、二进制文件、音频文件、图片文件、视频文件等,其中文本文件由于其文件内容的简单性,一般没有特定的文件头格式。

二、常用文件头

以下是一些常见的文件头:

    文件类型             文件头

    BMP 图片文件      424D
    GIF 图片文件      474946383961 or 474946383761
    JPG 图片文件      FFD8 or FFE0
    MP3 音频文件      FFFB
    AVI 视频文件      52494646
    ZIP 压缩文件      504B0304
    PDF 文档文件      255044462D312E

三、常见文件头值

文件头值是指不同类型文件所对应的文件头十六进制值。常见的文件头值包括:

    文件类型             文件头

    BMP 图片文件      42 4D
    GIF 图片文件      47 49 46 38 39 61 or 47 49 46 38 37 61
    JPG 图片文件      FF D8 or FF E0
    MP3 音频文件      FF FB
    AVI 视频文件      52 49 46 46
    ZIP 压缩文件      50 4B 03 04
    PDF 文档文件      25 50 44 46 2D 31 2E

四、常见文件图标

不同的文件类型在计算机中有不同的图标表示。常见的文件图标如下:

    文件类型            文件图标

    图片文件             图片图标
    音频文件             声音图标
    视频文件             视频图标
    压缩文件             文件夹加锁图标
    文档文件             文档图标

五、常见文件头编码

不同的文件类型需要采用不同的编码方式来存储文件头信息。常见的编码方式有ASCII码、Unicode码、UTF8码等。其中,ASCII码是一种用于计算机处理的编码方式,通常用一个字节(8位二进制数)表示一个字符,比较节省存储空间。

六、常见文件头文件尾

与文件头相对应的是文件尾,也就是文件的结尾标识。文件尾用来标示文件的结束,不同的文件类型也采用不同的文件尾格式。例如: JPEG、PDF等文件格式在文件末尾都有特定的结束标识。

七、常见文件头格式excel

Excel的文件头一般是采用二进制格式进行存储的。由于Excel文件包含多个Sheet,因此文件头也需要记录Sheet的相关信息。在Excel文件中,文件头的大小为8字节,其中第7-8字节是一个长整数,表示Sheet的数量,即一个Excel文件最多包含多少个Sheet。

八、十六进制常见文件头

十六进制是指一种用16个字符(0~9、A~F)表示数字的计数法。常见的文件头格式通常以十六进制数的形式呈现。以下是一些常见文件类型的十六进制文件头:

    文件类型             文件头

    BMP 图片文件      42 4D
    GIF 图片文件      47 49 46 38 39 61 or 47 49 46 38 37 61
    JPG 图片文件      FF D8 FF E0 or FF D8 FF E1
    MP3 音频文件      FF FB
    AVI 视频文件      52 49 46 46
    ZIP 压缩文件      50 4B 03 04
    PDF 文档文件      25 50 44 46 2D 31 2E

九、常见视频文件

视频文件在计算机中也有着广泛的运用,以下是一些常见的视频文件类型及其文件头:

    文件类型             文件头

    AVI              52 49 46 46
    FLV              46 4C 56 01
    MP4              00 00 00 18 66 74 79 70 69 73 6F 6D
    WMV              30 26 B2 75 8E 66 CF 11 A6 D9 00 AA 00 62 CE 6C

十、文件头格式标准选取

文件头格式标准是指为不同文件类型设置统一的文件头格式,以方便计算机进行文件识别。什么样的文件头格式标准是合适的呢?通常应考虑以下因素:

  • 文件头格式应尽量短小,节省存储空间
  • 文件头格式应尽量规范化,方便计算机处理
  • 文件头格式应足够复杂,在保障一定唯一性的同时,也提高了计算机的识别准确度

综合以上几点因素,可以选取较短的、符合规范的、复杂的文件头格式进行标准化。例如,BMP图片文件的文件头格式为“424D”;MP3音频文件的文件头格式为“FFFB”。

以下是一个Python编写的文件识别函数实例,可以通过该函数来识别文件的类型:

import binascii

def get_file_type(file_path):
    with open(file_path, 'rb') as f:
        head = f.read(4)
        filetype = ''
        if head.hex() == "89504e47":
            filetype = 'PNG'
        elif head.hex() == '47494638':
            filetype = 'GIF'
        elif head.hex() == '49492A00' or head.hex() == '4D4D002A':
            filetype = 'TIFF'
        elif head.hex() == 'FFD8FFDB' or head.hex() == 'FFD8FFE0':
            filetype = 'JPEG'
        elif head.hex() == '49534103':
            filetype = 'MP3'
        elif head.hex() == '52494646':
            next_four = f.read(4)
            if next_four == b'\x57\x41\x56\x45' or next_four == b'\x41\x56\x49\x20':
                filetype = 'AVI'
            else:
                filetype = 'WAV'
        elif head.hex() == '52494646':
            filetype = 'WMA'
        elif head.hex() == '3026B2758E66CF11':
            filetype = 'WMV'
        else:
            filetype = 'Unkown type'
        return filetype

原创文章,作者:小蓝,如若转载,请注明出处:https://www.506064.com/n/189445.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
小蓝小蓝
上一篇 2024-11-29 08:03
下一篇 2024-11-29 08:03

相关推荐

  • vue下载无后缀名的文件被加上后缀.txt,有后缀名的文件下载正常问题的解决

    本文旨在解决vue下载无后缀名的文件被加上后缀.txt,有后缀名的文件下载正常的问题,提供完整的代码示例供参考。 一、分析问题 首先,需了解vue中下载文件的情况。一般情况下,我们…

    编程 2025-04-29
  • 如何在Java中拼接OBJ格式的文件并生成完整的图像

    OBJ格式是一种用于表示3D对象的标准格式,通常由一组顶点、面和纹理映射坐标组成。在本文中,我们将讨论如何将多个OBJ文件拼接在一起,生成一个完整的3D模型。 一、读取OBJ文件 …

    编程 2025-04-29
  • 为什么用cmd运行Java时需要在文件内打开cmd为中心

    在Java开发中,我们经常会使用cmd在命令行窗口运行程序。然而,有时候我们会发现,在运行Java程序时,需要在文件内打开cmd为中心,这让很多开发者感到疑惑,那么,为什么会出现这…

    编程 2025-04-29
  • Python程序文件的拓展

    Python是一门功能丰富、易于学习、可读性高的编程语言。Python程序文件通常以.py为文件拓展名,被广泛应用于各种领域,包括Web开发、机器学习、科学计算等。为了更好地发挥P…

    编程 2025-04-29
  • Python中读入csv文件数据的方法用法介绍

    csv是一种常见的数据格式,通常用于存储小型数据集。Python作为一种广泛流行的编程语言,内置了许多操作csv文件的库。本文将从多个方面详细介绍Python读入csv文件的方法。…

    编程 2025-04-29
  • Python将矩阵存为CSV文件

    CSV文件是一种通用的文件格式,在统计学和计算机科学中非常常见,一些数据分析工具如Microsoft Excel,Google Sheets等都支持读取CSV文件。Python内置…

    编程 2025-04-29
  • Python zipfile解压文件乱码处理

    本文主要介绍如何在Python中使用zipfile进行文件解压的处理,同时详细讨论在解压文件时可能出现的乱码问题的各种解决办法。 一、zipfile解压文件乱码问题的根本原因 在P…

    编程 2025-04-29
  • Python如何导入py文件

    Python是一种开源的高级编程语言,因其易学易用和强大的生态系统而备受青睐。Python的import语句可以帮助用户将一个模块中的代码导入到另一个模块中,从而实现代码的重用。本…

    编程 2025-04-29
  • Python合并多个相同表头文件

    对于需要合并多个相同表头文件的情况,我们可以使用Python来实现快速的合并。 一、读取CSV文件 使用Python中的csv库读取CSV文件。 import csv with o…

    编程 2025-04-29
  • Python写文件a

    Python语言是一种功能强大、易于学习、通用并且高级编程语言,它具有许多优点,其中之一就是能够轻松地进行文件操作。文件操作在各种编程中都占有重要的位置,Python作为开发人员常…

    编程 2025-04-29

发表回复

登录后才能评论