PCM文件详解

一、PCM文件格式

1、PCM文件指的是一种无损音频文件格式,是由音频采样数值序列直接表示波形的一种编码方式。

2、PCM文件有多种采样格式,包括带符号/无符号的8位、16位、24位和32位等。

3、PCM文件采样率也有多种选择,常见的包括44.1kHz和48kHz等。

4、每个采样点的大小根据采样格式而定,例如8位PCM每个采样点大小为1字节,16位PCM每个采样点大小为2字节。

二、PCM文件读取

1、使用C++语言读取PCM文件可以借助标准库中的文件流,例如:

std::ifstream pcmFile("audio.pcm", std::ios::binary | std::ios::in);
if (pcmFile.is_open()) {
    char* buffer = new char[pcmFileSize];
    pcmFile.read(buffer, pcmFileSize);
    pcmFile.close();
}

2、读取的PCM数据可以直接交给音频处理器进行处理或保存为WAV文件等其他格式。

三、PCM文件处理

1、PCM文件的处理包括音频剪辑、降噪、增益调整等多种功能,以下是对其中一种功能的实现:

2、音频增量调整的实现可以通过简单的乘法运算来实现,例如将音频增益调整为原来的2倍:

for (int i = 0; i < pcmDataSize; i += 2) {
    int16_t pcmData = buffer[i] | buffer[i + 1] << 8;
    pcmData *= 2;
    buffer[i] = pcmData & 0xff;
    buffer[i + 1] = (pcmData >> 8) & 0xff;
}

3、以上代码中,每个采样点通过位运算和数据类型转换得到16位有符号整数,再进行乘法运算调整增益,最后再将结果转换回字节流储存。

四、PCM文件播放

1、使用C++语言进行PCM数据的播放可以借助第三方库,例如OpenAL和SDL等。

2、以下是使用SDL库播放PCM数据的示例代码:

SDL_AudioSpec spec;
spec.freq = 44100;
spec.format = AUDIO_S16SYS;
spec.channels = 2;
spec.samples = 1024;
spec.callback = pcmPlayerCallback;
spec.userdata = buffer;
if (SDL_OpenAudio(&spec, NULL) < 0) {
    // error handling
}
SDL_PauseAudio(0);

3、以上代码中,设置了音频参数,并在回调函数pcmPlayerCallback中将PCM数据写入音频流。

五、PCM文件转换

1、PCM文件可以转换为其他音频格式,例如WAV、MP3等,常见的方法是使用FFmpeg等第三方库。

2、以下是使用FFmpeg库将PCM文件转换为WAV格式的示例代码:

AVFormatContext* fmt_ctx = NULL;
AVCodecContext* enc_ctx = NULL;
AVCodec* codec = NULL;
AVPacket pkt = { 0 };
AVFrame* frame = NULL;
int ret = 0;

// initialize demuxer and output format
ret = avformat_open_input(&fmt_ctx, pcmFileName.c_str(), NULL, NULL);
// error handling
ret = avformat_find_stream_info(fmt_ctx, NULL);
// error handling
AVOutputFormat* output_format = av_guess_format("wav", NULL, NULL);
AVFormatContext* out_fmt_ctx = NULL;
ret = avformat_alloc_output_context2(&out_fmt_ctx, output_format, NULL, NULL);
// error handling

// initialize encoder
codec = avcodec_find_encoder_by_name("pcm_s16le");
enc_ctx = avcodec_alloc_context3(codec);
// set encoder parameters
enc_ctx->bit_rate = 1411200;
enc_ctx->sample_rate = 44100;
enc_ctx->sample_fmt = AV_SAMPLE_FMT_S16;
enc_ctx->channels = 2;

// add audio stream to output format
AVStream* audio_stream = avformat_new_stream(out_fmt_ctx, NULL);
// error handling
audio_stream->id = out_fmt_ctx->nb_streams - 1;
audio_stream->time_base = { 1, enc_ctx->sample_rate };
// copy encoder parameters to output stream
avcodec_parameters_from_context(audio_stream->codecpar, enc_ctx);

// initialize encoder
ret = avcodec_open2(enc_ctx, codec, NULL);
// error handling
frame = av_frame_alloc();
// error handling
frame->format = enc_ctx->sample_fmt;
frame->nb_samples = enc_ctx->frame_size;
frame->channels = enc_ctx->channels;
ret = av_frame_get_buffer(frame, 0);
// error handling

// initialize muxer
avio_open(&out_fmt_ctx->pb, wavFileName.c_str(), AVIO_FLAG_WRITE);
// error handling
ret = avformat_write_header(out_fmt_ctx, NULL);
// error handling

// read PCM data and encode to output format
while (av_read_frame(fmt_ctx, &pkt) == 0) {
    AVPacket out_pkt = { 0 };
    ret = avcodec_send_packet(enc_ctx, &pkt);
    // error handling
    while (ret >= 0) {
        ret = avcodec_receive_frame(enc_ctx, frame);
        if (ret == AVERROR_EOF || ret == AVERROR(EAGAIN)) {
            break;
        }
        // error handling
        ret = avcodec_send_frame(enc_ctx, frame);
        // error handling
        while (ret >= 0) {
            ret = avcodec_receive_packet(enc_ctx, &out_pkt);
            if (ret == AVERROR_EOF || ret == AVERROR(EAGAIN)) {
                break;
            }
            // error handling
            av_packet_rescale_ts(&out_pkt, enc_ctx->time_base, audio_stream->time_base);
            out_pkt.stream_index = audio_stream->index;
            av_interleaved_write_frame(out_fmt_ctx, &out_pkt);
            av_packet_unref(&out_pkt);
        }
    }
    av_packet_unref(&pkt);
}

// write trailer
av_write_trailer(out_fmt_ctx);

// free resources
av_frame_free(&frame);
avcodec_free_context(&enc_ctx);
avformat_close_input(&fmt_ctx);
avio_close(out_fmt_ctx->pb);
avformat_free_context(out_fmt_ctx);

3、以上代码中,使用FFmpeg库进行音频编码和封装,其中使用PCM_S16LE编码格式进行编码,最终将PCM文件转换成WAV格式。

原创文章,作者:HZRKE,如若转载,请注明出处:https://www.506064.com/n/332763.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
HZRKEHZRKE
上一篇 2025-01-27 13:34
下一篇 2025-01-27 13:34

相关推荐

  • vue下载无后缀名的文件被加上后缀.txt,有后缀名的文件下载正常问题的解决

    本文旨在解决vue下载无后缀名的文件被加上后缀.txt,有后缀名的文件下载正常的问题,提供完整的代码示例供参考。 一、分析问题 首先,需了解vue中下载文件的情况。一般情况下,我们…

    编程 2025-04-29
  • 如何在Java中拼接OBJ格式的文件并生成完整的图像

    OBJ格式是一种用于表示3D对象的标准格式,通常由一组顶点、面和纹理映射坐标组成。在本文中,我们将讨论如何将多个OBJ文件拼接在一起,生成一个完整的3D模型。 一、读取OBJ文件 …

    编程 2025-04-29
  • Python中读入csv文件数据的方法用法介绍

    csv是一种常见的数据格式,通常用于存储小型数据集。Python作为一种广泛流行的编程语言,内置了许多操作csv文件的库。本文将从多个方面详细介绍Python读入csv文件的方法。…

    编程 2025-04-29
  • Python程序文件的拓展

    Python是一门功能丰富、易于学习、可读性高的编程语言。Python程序文件通常以.py为文件拓展名,被广泛应用于各种领域,包括Web开发、机器学习、科学计算等。为了更好地发挥P…

    编程 2025-04-29
  • 为什么用cmd运行Java时需要在文件内打开cmd为中心

    在Java开发中,我们经常会使用cmd在命令行窗口运行程序。然而,有时候我们会发现,在运行Java程序时,需要在文件内打开cmd为中心,这让很多开发者感到疑惑,那么,为什么会出现这…

    编程 2025-04-29
  • Python zipfile解压文件乱码处理

    本文主要介绍如何在Python中使用zipfile进行文件解压的处理,同时详细讨论在解压文件时可能出现的乱码问题的各种解决办法。 一、zipfile解压文件乱码问题的根本原因 在P…

    编程 2025-04-29
  • Python将矩阵存为CSV文件

    CSV文件是一种通用的文件格式,在统计学和计算机科学中非常常见,一些数据分析工具如Microsoft Excel,Google Sheets等都支持读取CSV文件。Python内置…

    编程 2025-04-29
  • Python如何导入py文件

    Python是一种开源的高级编程语言,因其易学易用和强大的生态系统而备受青睐。Python的import语句可以帮助用户将一个模块中的代码导入到另一个模块中,从而实现代码的重用。本…

    编程 2025-04-29
  • Python合并多个相同表头文件

    对于需要合并多个相同表头文件的情况,我们可以使用Python来实现快速的合并。 一、读取CSV文件 使用Python中的csv库读取CSV文件。 import csv with o…

    编程 2025-04-29
  • Python写文件a

    Python语言是一种功能强大、易于学习、通用并且高级编程语言,它具有许多优点,其中之一就是能够轻松地进行文件操作。文件操作在各种编程中都占有重要的位置,Python作为开发人员常…

    编程 2025-04-29

发表回复

登录后才能评论