| MPEG-2标准技术细节
来源: 作者: 发布时间:2005-12-5 10:20:37
含多个帧。帧的帧类通常包括I-帧、P-帧和B-帧。其中I-帧采用帧内编码,P-帧采用前向估计,B-帧采用双向估计。
一般来说输入视频格式是25(CCIR标准)或者29.97 (FCC)帧/秒。
MPEG-2支持隔行扫描和逐行扫描。在逐行扫描模式下,编码的基本单元是帧。在隔行扫描模式下,基本编码但是可以是帧,也可以是场(field)。
原始输入图像首先被转换到YCbCr颜色空间。其中Y是亮度,Cb和Cr是两个色度信道。对于每一信道,首先采用块分割,然后形成“宏块”(macroblocks),宏块构成了编码的基本单元。每一个宏块再分割成8x8的小块。色度信道份更成小块的数目取决于初始参数设置。例如,在常用的4:2:0格式下,每个色度宏块只采样出一个小块,所以三个信道宏块能够分割成的小块数目是4+1+1=6个。
对于I-帧,整幅图像直接进入编码过程。对于P-帧和B-帧,首先做运动补偿。通常来说,由于相邻帧之间的相关性很强,宏块可以在前帧和后帧中对应相近的位置找到相似的区域匹配的比较好,这个偏移量作为运动向量被记录下来,运动估计重构的区域的误差被送到编码器中编码。
对于每一个8x8小块,离散余弦变换-discrete cosine transform把图像从空间域转换到频域。得到的变换系数被量化并重新组织排列顺序,从而增加长零的可能性。之后做游程长编码(run-length code)。最后作哈夫曼(huffman encoding)编码。
I帧编码是为了减少空间域冗余,P帧和B帧是为了减少时间域冗余。
GOP是由固定模式的一系列I帧、P帧、B帧组成。常用的结构由15个帧组成,具有以下形式IBBPBBPBBPBBPBB。GOP中各个帧的比例的选取和带宽、图像的质量要求有一定关系。例如因为B帧的压缩时间可能是I帧的三倍,所以对于计算能力不强的某些实时系统,可能需要减少B帧的比例。
MPEG-2输出的比特流可以使匀速或者变速的。最大比特率,例如在DVD应用上,可达10.4 Mbit/s。如果要使用固定比特率,量化尺度就需要不断的调节以产生匀速的比特流。但是,提高量化尺度可能带来可视的失真效果。比如马赛克现象。
[编辑] MPEG-2音频编码 MPEG-2的音频编码包括:
低比特率下的MPEG-1 Layer 1/2/3 LSF。 多信道编码 MPEG-2 AAC。 [编辑] MPEG-2在DVD上的应用 DVD中采用了MPEG-2标准并引入如下技术参数限制:
分辨率 720 x 480, 704 x 480, 352 x 480, 352 x 240 像素 (NTSC制式) 720 x 576, 704 x 576, 352 x 576, 352 x 288 像素 (PAL制式) 纵横比 4:3 16:9 帧率(帧播放速度) 59.94 帧/秒,23.976帧/秒, 29.97帧/秒(NTSC) 50 帧/秒,25帧/秒(PAL) 视频+音频 比特率 平均最大缓冲区 9.8 Mbit/s 峰值 15 Mbit/s 最小值 300 Kbit/s YUV 4:2:0 字幕支持 内嵌字幕支持(NTSC only) 音频 LPCM编码:48kHz或96kHz;16或24-bit;最多可达6声道 MPEG Layer 2 (MP2):48 kHz,可达5.1声道 杜比数字-Dolby Digital(DD,也称为AC-3):48 kHz,32-448 kbit/s,可达5.1声道 数字家庭影院系统-Digital Theater Systems (DTS):754 kbit/s或1510 kbit/s NTSC制式DVD必须包含至少一道LPCM或Dolby Digital PAL制式DVD必须包含至少一道MPEG Layer 2、LPCM或者Dolby Digital GOP结构 必须为GOP提供序列的头信息 GOP最大可含帧数目:18 (NTSC) / 15 (PAL)
添加到收藏夹
|
|
|
|