10

在过去的几周里,我有机会阅读了两份文件:

  • MPEG-4 Part 2 规范 (ISO/IEC 14496-2),人们称之为“mpeg-4”
  • MPEG-4 Part 10 规范 (ISO/IEC 14496-10),也称为“h.264”或“AVC”

在阅读了“mpeg-4”中所有很酷的想法之后,比如识别面部表情、人的四肢运动和精灵,我真的很兴奋。对于 1999 年的想法,这些想法听起来很有趣,甚至可能很棒。

但后来我阅读了“h.264”标准,这些想法都没有。有很多关于如何编码像素的讨论,但没有一个很酷的想法。

发生了什么?为什么这些想法被删除了?

这不是代码问题,但作为一名程序员,我觉得我应该尽可能多地理解规范背后的意图。如果我编写的代码符合规范的使用精神,那么它更有可能被定位为利用整个规范。

4

2 回答 2

14

您似乎在假设 MPEG-4 Part 10 规范改进了 MPEG-4 Part 2,而事实是这两个规范是不相关的,没有共同之处,甚至是由不同的人开发的(MPEG 开发了 Part 2 2 规范,而 ITU-T、ISO、IEC 和 MPEG 共同制定了 Part 10 规范)。

请记住,ISO/IEC 14496 标准是适用于视听编码不同方面的规范集合。第 2 部分规范的目标是对不同种类的视觉对象(视频、3D 对象等)进行编码。第 10 部分的目标是为视频提供非常高效和高质量的编码。标准的其他部分处理其他方面,例如第 3 部分规范处理音频编码,第 12 部分和第 15 部分定义了最常用于包装第 10 部分视频(即 H.264)和第 3 部分的容器文件格式音频(即 AAC)转换为单个文件,即所谓的 .mp4 格式。

我希望这有帮助!

于 2012-03-27T06:46:09.187 回答
1

一点历史可能会有所帮助。

MPEG-4 被设计为不同类型的媒体相关数据通信的载体/容器规范。要符合要求,设备只需识别和忽略内容。

这是对 MPEG-1 规范生命周期短的一种反应,这些规范在正式化之前就已经过时了。

MPEG-4可以分为

传输图像生成数据的机制

这些包括明显的事情,比如

  • 压缩
  • 运动补偿和显式精灵

实验如

  • 从图像流(视频)传输和重建 3D 和 3D + 时间数据,以提供压缩和特征扩展。

速率适应机制

1999 年,相关比特率范围很广,从 128K 拨号到 1000 Mbit L/M/WAN,该规范有许多特殊情况和提供互操作性的努力。

这产生了许多委员会工作,随着网络性能范围缩小到 1Mbit 到 100Mbit 的最小值/最大值,这些工作变得多余。

最初,除了 H.264 等竞争性规范外,太阳下的所有规范和一些仍在创作者脑海中的规范都附加到 MPEG-4 框架。

随着 dot.com 的崩溃以及 H.264 和其他规范并入 MPEG4,一些规范逐渐消失。

我从中学到的一件事是阅读规范时至少没有示例实现,而通常有趣却很少有成效。

我想“使用源卢克”可能适用

或者

“没有来源的规格味道不好”。

于 2012-03-29T10:53:26.573 回答