AvFrame和AvPacket
在FFmpeg中,未压缩的图像和压缩的视频码流分别使用AVFrame结构和AVPacket结构保存; 针对视频编码器,其流程为从数据源获取图像格式的输入数据,保存为AVFrame对象并传入编码器,从编码器输出AVPacket结构。
1. AVFrame结构体
typedef struct AVFrame {
#define AV_NUM_DATA_POINTERS 8 //表示一个AVFrame结构最多保存8个图像分量;
//待编码的图像像素数据保存在其中,各图像分量的像素数据保存在AVframe::data[0]~data[7]
uint8_t *data[AV_NUM_DATA_POINTERS];
int linesize[AV_NUM_DATA_POINTERS]; //每个分量的存储区的宽度,称为步长;
/*指向数据平面/通道的指针。
对于视频,指向data[]
对于planar音频,每个通道有分离的数据指针,且linesize[0]包含每个通道buffer的大小;
对于packed音频,仅仅是一个数据指针,且linesize[0]包含所有通道buffer的总大小;
*/
uint8_t **extended_data;
//图像宽高
int width, height;
//本帧描述的音频采样数(每个频道)
int nb_samples;
//帧格式,常见的为AV_PIX_FMT_YUV420P
int format;
int key_frame; //当前帧的关键帧标识位;1表该帧为关键帧;0表非关键帧;
enum AVPictureType pict_type;//当前帧的类型,0,1,2分别表示I帧,P帧,B帧;
//采样视频帧的长宽比,如果未知/未指定,则为0/1;
AVRational sample_aspect_ratio;
int64_t pts;//当前帧的显示时间戳;
#if FF_API_PKT_PTS
//PTS复制自AVPacket,被解码产生此帧。
int64_t pkt_pts;
#endif
//dts从触发返回帧的AVPacket中复制
//这也是由AVPacket计算出的AVFrame的显示时间。 无PTS值的DTS值
int64_t pkt_dts;
//按位流顺序排列的图片编号
int coded_picture_number;
//图片编号按显示顺序排列
int display_picture_number;
//质量
int quality;
void *opaque; //用户私有数据
//当解码时,这表示图像必须延迟多少
int repeat_pict;
//图片的内容是交错的
int interlaced_frame;
//如果内容是交错的,则首先显示顶部字段。
int top_field_first;
//告诉用户应用程序调色板已从上一帧更改。
int palette_has_changed;
int64_t reordered_opaque;
//音频数据采样速率
int sample_rate;
//音频数据的通道布局。
uint64_t channel_layout;
//AVBuffer引用支持这个帧的数据
AVBufferRef *buf[AV_NUM_DATA_POINTERS];
AVBufferRef **extended_buf;
//扩展buf中的元素数目
int nb_extended_buf;
AVFrameSideData **side_data;
int nb_side_data;
//帧标志
int flags;
enum AVColorRange color_range;
enum AVColorPrimaries color_primaries;
enum AVColorTransferCharacteristic color_trc;
enum AVColorSpace colorspace;
enum AVChromaLocation chroma_location;
//帧时间戳估计使用各种启发式
int64_t best_effort_timestamp;
//从输入到解码器的最后一个AVPacket重新排序pos
int64_t pkt_pos;
//对应报文的持续时间,以AVStream->time_base units表示,如果未知则为0
int64_t pkt_duration;
AVDictionary *metadata;
//音频通道数,仅用于音频
int channels;
//包含压缩帧的相应数据包的大小
int pkt_size;
AVBufferRef *hw_frames_ctx;
AVBufferRef *opaque_ref;
size_t crop_top;
size_t crop_bottom;
size_t crop_left;
size_t crop_right;
AVBufferRef *private_ref;
} AVFrame;
在AVFrame结构中,它所包含的最重要的结构即数据的缓存区;待编码的数据的像素数据保存在AVFrame结构的data指针所保存的内存区中;
一个AVFrame结构最多可以保存8个图像分量,各图像分量的像素数据保存在AVFrame::data[0]~AVFrame::data[7]所指向的内存区中;
1.1 创建AVFrame结构的实例并初始化
AVFrame *av_frame_alloc(void);
注:仅仅创建AVFrame结构的实例,以及初始化内部各个字段的值,并没有分配用于存储其内部图像的内存空间;
1.2 给AVFrame结构体中的音视频数据分配内存空间
int av_frame_get_buffer(AVFrame *frame, int align);
作用:实际分配内存空间;
参数1:AVFrame指针;
参数2:对齐方式,<=0表示以32字节对齐;否则以align对齐;
示例:
//创建AVFrame结构的实例并初始化;
//仅仅创建AVFrame的实例,并没有分配用于存储其内部图像的内存空间;
frame = av_frame_alloc();
if (!frame) {
fprintf(stderr, "Could not allocate video frame\n");
exit(1);
}
frame->format = c->pix_fmt;
frame->width = c->width;
frame->height = c->height;
//给AVFrame结构中的音视频数据分配内存空间;
ret = av_frame_get_buffer(frame, 0);
if (ret < 0) {
fprintf(stderr, "Could not allocate the video frame data\n");
exit(1);
}
1.3 将保存了图像数据的AVFrame结构传入编码器
int avcodec_send_frame(AVCodecContext *avctx, const AVFrame *frame);
参数1:当前编码器的上下文结构l;
参数2:待编码的图像结构;当该参数为NULL时表示编码结束,此时应该刷新编码器缓存的码流;
返回值:0:正常执行; 负数表错误码;
AVERROR(EAGAIN):输入缓存已满,应该调用avcodec_receive_packet获取输出数据后在尝试输入;
AVERROR_EOF:编码器已收到刷新指令,不再接收的图像输入;
VERROR(EINVAL):编码器状态错误;
VERROR(ENOMEM):内存空间不足;
1.4 释放分配的图像帧结构
void av_frame_free(AVFrame **frame)
2. AVPacket结构体
typedef struct AVPacket {
AVBufferRef *buf;
int64_t pts;//当前packet的显示时间戳;必须大于等于dts
int64_t dts;//当前packet的解码时间戳,以AVStream的time_base为单位;
uint8_t *data;//码流数据保存在data指针指向的内存;
int size;//数据长度为size字节;可通过data和size读取编码后的码流;
int stream_index;//当前packet所从属的stream序号;
int flags;
AVPacketSideData *side_data;
int side_data_elems;
//当前packet的显示时长,即按照顺序显示下一帧pts与当前pts的差值;
int64_t duration;
//当前packet在数据流中的二进制位置; -1表示未知;
int64_t pos;
} AVPacket;
2.1 创建AVPacket结构的实例并初始化
AVPacket *av_packet_alloc(void);
2.2 依照一个已存在的packet创建新的packet,新packet是对原packet的引用
AVPacket *av_packet_clone(const AVPacket *src);
2.3 释放一个packet,若该packet存在引用计数,则其引用计数减1
void av_packet_free(AVPacket **pkt);
2.4 按照指定大小分配一个packet的存储空间,并初始化该packet
int av_new_packet(AVPacket *pkt, int size);
2.5 根据传入的packet创建新的引用packet
int av_packet_ref(AVPacket *dst, const AVPacket *src);
2.6 回收该packet
void av_packet_unref(AVPacket *pkt);
2.7 从编码器中获取输出的码流,并保存在传入的AVPacket结构中
int avcodec_receive_packet(AVCodecContext *avctx, AVPacket *avpkt);
参数1:当前编码器上下文结构;
参数2:输出的码流包结构,包含编码器输出的视频码流;
返回值:0表正常,负数为错误码;
AVERROR(EAGAIN):编码器尚未完成对新一帧的编码,应继续通过函数avcodec_send_frame传入后续图像;
AVERROR_EOF:编码器已经完成输出内部缓存的码流,编码完成;
VERROR(EINVAL):编码器状态错误;