音视频 day15 AAC 解码成 PCM
1. 如何使用命令行将 aac 解码为 pcm ?
ffmpeg -c:a libfdk_aac -i in.aac -f s16le out.pcm 复制代码
2. AVCodecParserContext
这个结构体主要作用是什么?核心函数时什么?
初始化
av_parser_init(codec->id);
其参数是codec_id
,所以同时只能解析一种数据AVCodecParserContext
用于解析输入的数据并把它们分成一帧一帧的压缩编码数据核心函数
av_parser_parse2()
解析数据获得一个 Packet,从输入的数据流中分离出一帧一帧
的编码压缩数据
。
3. 使用代码将 aac 解码为 pcm 的过程(涉及 6 个元素,比编码多一个)?
4. 使用代码将 aac 解码为 pcm 的完整代码
#include "ffmpegs.h" #include <QDebug> #include <QFile> extern "C" { #include <libavcodec/avcodec.h> #include <libavutil/avutil.h> } #define ERROR_BUF(ret) \ char errbuf[1024]; \ av_strerror(ret, errbuf, sizeof (errbuf)); // 输入缓冲区的大小 #define IN_DATA_SIZE 20480 // 需要再次读取输入文件数据的阈值 #define REFILL_THRESH 4096 FFmpegs::FFmpegs() { } static int decode(AVCodecContext *ctx, AVPacket *pkt, AVFrame *frame, QFile &outFile) { // 发送解码数据到解码器 int ret = avcodec_send_packet(ctx, pkt); if (ret < 0) { ERROR_BUF(ret); qDebug() << "avcodec_send_packet error" << errbuf; return ret; } while (true) { // 获取解码后的数据 ret = avcodec_receive_frame(ctx, frame); if (ret == AVERROR(EAGAIN) || ret == AVERROR_EOF) { return 0; } else if (ret < 0) { ERROR_BUF(ret); qDebug() << "avcodec_receive_frame error" << errbuf; return ret; } // 将解码后的数据写入文件 outFile.write((char *)frame->data[0], frame->linesize[0]); } } void FFmpegs::accDecode(const char *inFilename, AudioEncodeSpec &out) { // 返回结果 int ret = 0; // 用来存放读取的输入文件数据(aac) // 加上AV_INPUT_BUFFER_PADDING_SIZE是为了防止某些优化过得 reader 一次性读取过多导致越界 char inDataArray[IN_DATA_SIZE + AV_INPUT_BUFFER_MIN_SIZE]; char *inData = inDataArray; // 每次从输入文件中读取的长度(aac) int inLen; // 是否已经读取到了输入文件的尾部 int inEnd = 0; // 文件 QFile inFile(inFilename); QFile outFile(out.filename); // 解码器 AVCodec *codec = nullptr; // 上下文 AVCodecContext *ctx = nullptr; // 解析器上下文 AVCodecParserContext *parserCtx = nullptr; // 存放解码前的数据(aac) AVPacket *pkt = nullptr; // 存放解码后的数据(pcm) AVFrame *frame = nullptr; // 获取解码器 codec = avcodec_find_decoder_by_name("libfdk_aac"); if (!codec) { qDebug() << "avcodec_find_decoder_by_name error"; return; } // 初始化解析器上下文 parserCtx = av_parser_init(codec->id); if (!parserCtx) { qDebug() << "av_parser_init error"; return; } // 创建上下文 ctx = avcodec_alloc_context3(codec); if (!ctx) { qDebug() << "avcodec_alloc_context3 error"; goto end; } // 创建 AVPacket pkt = av_packet_alloc(); if (!pkt) { qDebug() << "av_packet_alloc error"; goto end; } // 创建 AVFrame frame = av_frame_alloc(); if (!frame) { qDebug() << "av_frame_alloc error"; goto end; } // 打开解码器 ret = avcodec_open2(ctx, codec, nullptr); if (ret < 0) { ERROR_BUF(ret); qDebug() << "avcodec_open2 error" << errbuf; goto end; } // 打开文件 if (!inFile.open(QFile::ReadOnly)) { qDebug() << "file open error:" << inFilename; goto end; } if (!outFile.open(QFile::WriteOnly)) { qDebug() << "file open error:" << out.filename; goto end; } // 读取文件数据 inLen = inFile.read(inData, IN_DATA_SIZE); while (inLen > 0) { // 经过解析器解析 // 内部调用的核心逻辑是:ff_aac_ac3_parse ret = av_parser_parse2(parserCtx, ctx, &pkt->data, &pkt->size, (uint8_t *)inData, inLen, AV_NOPTS_VALUE, AV_NOPTS_VALUE, 0); if (ret < 0) { ERROR_BUF(ret); qDebug() << "av_parser_parse2 error" << errbuf; goto end; } // 跳过已经解析过的数据 inData += ret; // 减去已经解析过的数据大小 inLen -= ret; // 解码 if (pkt->size > 0 && decode(ctx, pkt, frame, outFile) < 0 ) { goto end; } // 检查是否需要读取新的文件数据 if (inLen < REFILL_THRESH && !inEnd) { // 剩余数据移动到缓冲区的最前面 memmove(inDataArray, inData, inLen); // 重置 inData inData = inDataArray; // 读取文件数据到 inData+inLen 的位置 int len = inFile.read(inData + inLen, IN_DATA_SIZE - inLen); if (len > 0) { // 有读取到文件数据 inLen += len; } else { // 文件中已经没有任何数据 // 标记为已经读到文件的尾部 inEnd = 1; } } } // 刷新缓冲区 decode(ctx, nullptr, frame, outFile); // 赋值输入参数 out.sampleRate = ctx->sample_rate; out.sampleFmt = ctx->sample_fmt; out.chLayout = ctx->channel_layout; end: inFile.close(); outFile.close(); av_packet_free(&pkt); av_frame_free(&frame); av_parser_close(parserCtx); avcodec_free_context(&ctx); }
作者:carrot__lsp
链接:https://juejin.cn/post/6959442452608450567