DVD，VCD有什么区别。HVD？

[转贴DVD、HDV、EVD和HVD编码技术分析。

一、国际音频编码技术的现状和发展趋势

目前，国际运动图像专家组(MPEG)已经推出了几种音频编码技术。其中，MPEG-1(ISO/IEC 11172-3)根据编码复杂度分为三层，支持32、44.1、48KHz采样率的单声道和双单声道编码。第三层(MP3)，在编码双声道立体声时，以128Kbit/s编码大部分音乐，可以达到接近CD的音质效果，成为网络音乐和便携式电子设备的首选标准。MPEG-2bc(ISO/IEC 13818-3)是MPEG-1的后向兼容多声道扩展方案，增加了“低频效果”声道升级为5.1声道编码，支持16、22.5、24KHz采样音频。标志着MPEG最高技术水平的MPEG-2高级音频编码(ISO/IEC 13818-7 AAC)，以8 ~ 96 kHz的采样率，提供1 ~ 48通道的可选范围的高质量音频编码。适用于从比特率为8kbit/s的电话音质到160kbit/s的多声道高质量音频编码，使用AAC对单声道音频进行编码，在64Kbit/s下，大部分音乐的质量可以接近CD。因此相对于MP3的96Kbit/s，编码效率有了很大的提高，被认为是下一代音频编码标准。

在多声道环绕声编码方面，美国杜比实验室的AC-3提供了32、44.1、48KHz采样的音频信号的编码，从单声道到5.1环绕声，支持32kbit/s到640kbit/s的多声道高质量音频码流..目前，DolbyAC-3凭借其良好的声场和声像再现能力，已经广泛应用于电影、家庭影院、DVD、数字电视音响等领域，成为事实上的国际标准。

其他优秀的音频编码技术，如索尼的ATARC、贝尔实验室的PAC、微软的WMA等都得到了广泛的应用。

目前，从国际数字音频应用的发展来看，数字音频编码技术已经广泛应用于互联网、广播、个人消费电子产品、数字影视等领域。随着3G技术的兴起，它正在进入移动通信领域。因此，新一代数字音频编码技术在传输可靠性、带宽要求、版权安全等方面都有更高的要求。

中国在数字音频编码领域起步较晚。目前，开展数字音频编码技术研究的高校有清华大学、天津大学、西安电子科技大学、哈尔滨工业大学、华南理工大学、东南大学、北京邮电大学等。，尚未取得成熟完整的成果。

二、图像和视频编码的国际标准和技术特点

在过去的10年中，图像编码技术得到了迅速而广泛的发展，并日趋成熟。其标志是关于图像编码的几个国际标准的制定，即静止图像的国际标准化组织(ISO)和国际电工委员会(IEC)编码标准JPEG，运动图像的ITU-T视频编码标准H 261、H 263和ISO/IEC编码。这些标准的图像编码算法综合了各种优秀的图像编码方法，代表了目前图像编码的发展水平。

1、JPEG(联合图像专家组)

JPEG是ISO/IEC联合图像专家组制定的静止图像压缩标准，是适用于连续色调(包括灰度和彩色)静止图像压缩算法的国际标准。JPEC算法* * *有四种运行模式，其中一种是基于空间预测的无损压缩算法(DPCM)，另外三种是基于DCT的有损压缩算法。

1)无损压缩算法，可以保证原图像无失真重建。

2)基于DCT的顺序模式，对图像进行自上而下、自左而右的编码，称为基本系统。

3)基于DCT的渐进模式是指从粗到细对图像进行编码。

4)分层模式。对各种分辨率的图像进行编码，可以根据不同的要求获得不同分辨率的图像。

JEPG对图像压缩有很大的伸缩性，图像质量与比特率的关系如下:

A) 1.5 ~ 2.0 bit/pixel:与原图基本没有通透感。

B) 0.75 ~ 1.5 bit/pixel:质量优秀，满足大部分应用。

C) 0.5 ~ 0.75比特/像素:良好到非常好的质量，满足大多数应用。

D) 0.25 ~ 0.5 bit/pixel:质量中等到非常好，满足部分应用。

2、JPEG-2000

与之前的JPEG标准相比，JPEG-2000的压缩比比JPEG高30%左右，具有很多无法比拟的优势。JPEG-2000与传统JPEG最大的区别在于它摒弃了基于DCT变换的块编码方法，改为基于小波变换的多分辨率编码方法。

首先，JPEG-2000可以实现无损压缩。在实际应用中，有一些重要的图像，如卫星遥感图像、医学图像和文物照片等，通常需要进行无损压缩。预测方法是一种经典的图像无损编码方法，已经被开发并作为标准写入JPEG-2000。

JPEG-2000的另一个优点是它对bi恐怖的鲁棒性。因此，采用JPEG-2000的系统稳定性好，运行流畅，抗干扰性好，操作简单。

JPEG-2000可以实现渐进传输，这是JPEG-2000的一个极其重要的特点。它可以先传输图像的轮廓，再分步传输数据，不断提高图像质量以满足用户的需求，在网络传输中具有重要意义。使用JPEG-2000下载一张图片，用户可以先看到图片的轮廓或微缩图，再决定是否下载。而且在下载的时候，可以根据用户的需求和带宽来决定下载图像的质量，从而控制数据的大小。

JPEG-2000的另一个极其重要的优点是感兴趣区域的特性。用户可以在处理后的图像中指定感兴趣的区域，在压缩这些区域时指定特定的压缩质量，或者在恢复时指定特定的解压缩要求，这给人们带来了极大的方便。在某些情况下，图像中只有一小部分区域对用户有用，对这些区域采用高压缩比。能有效压缩数据量而不丢失重要信息，这是感兴趣区域编码方案采用的压缩策略。基于ROI的压缩方法的优点是结合了接收方的主观要求，实现了交互式压缩。

3、MPEG-1

国际标准化组织(ISO/IEC)MPEG(运动图像专家组)一直致力于运动图像及其伴音编码的标准化，并制定了一系列关于通用运动图像的国际标准。MPEG-1于1993年制定，是以1.5 Mbit/s的速率对数字存储媒体运动图像及其音频编码的国际标准，该标准的制定使基于CD-ROM和MP3产品的数字视频成为可能。MPEG-1的最大带宽为1.5Mbit/s，其中11Mbit/s用于视频，128Kbit/s用于音频，其余用于MPEG系统本身。

为了追求高压缩效率，去除图像序列的时间冗余，满足多媒体应用所必须的随机存取要求，MPEG-1视频将图像编码分为I帧、P帧、B帧和D帧四种类型。I帧是帧内编码帧，采用类似JPEG的帧内DCT编码，在几种编码类型中I帧的压缩比最低。P帧是预测编码帧，采用前向运动补偿预测和误差DCT编码，由前一I或P帧预测。B帧是双向预测编码帧，采用双向运动补偿预测和误差的DCT编码，前后用I或P帧预测，因此B帧的压缩效率最高。d帧是Dc编码帧，它只包含每个块的DC分量。MPEG-1利用运动补偿消除图像序列时间轴上的冗余，可以使P帧和B帧的压缩比远高于I帧。

4、MPEG-2

MPEG组织1995推出的MPEG-2标准是在MPEG-1标准基础上的进一步扩展和改进，主要是针对数字视频广播、高清晰度电视和数字视频光盘的4 ~ 9 MB IT/s运动图像及其伴音的编码标准。MPEG-2是数字电视机顶盒和DVD产品的基础。MPEG-2系统要求向后兼容MPEG-1系统，因此其语法具有良好的兼容性和可扩展性。MPEG-2和MPEG-1的目标是一样的，仍然是提高压缩比和音视频质量。采用的核心技术是块DCT和帧间运动补偿预测技术。MPEG-2视频允许高达100Mbit/s的数据速率，支持隔行视频格式和许多高级性能。考虑到视频信号隔行扫描的特点，MPEG-2专门设置了“按帧编码”和“按场编码”两种模式，并相应扩展了运动补偿和DCT方法，从而显著提高了压缩编码的效率。考虑到标准的通用性，增加了重要的参数值，允许更大的图像格式、比特率和运动矢量长度。此外，MPEG-2视频压缩编码已扩展如下:

1)输入/输出图像颜色分量的比例可以是4: 2: 0、4: 2: 2、4: 4: 4。

2)输入/输出图像格式不受限制。

3)可以直接处理隔行扫描的视频信号。

4)在空间分辨率、时间分辨率和信噪比方面的可伸缩性适合于不同目的的解码图像的要求，并且在传输中可以给予不同级别的优先级。

5)码流结构的可伸缩性，如头信息和运动矢量，可以给予较高的优先级，而DCT系数的高频分量可以给予较低的优先级。

6)输出码率可以是恒定的，也可以是可变的，以适应同步和异步传输。

MPEG-2视频是一系列系统，每个系统都有安排好的兼容性和兼容性。它允许四种源格式或级别的编码，从简单的清晰度(CIF格式)到完整的高清晰度电视(HDTV)。除了这种源格式的灵活性之外，MPEG-2还提供了四个级别、五个类别和***11个从低到高分辨率的独立技术规范。同一类别的图像分辨率和码率相差甚远。表2显示了MPEG-2允许的级别和类别的组合。

5、MPEG-3

MPEG-3是最初由ISO/IEC为HDTV开发的编码和压缩标准。它要求传输速率在20Mbits/sev-40Mbits/sec之间，但这会使画面略有失真。然而，由于MPEG-2的优异性能，原本为高清电视设计的MPEG-3在诞生之前就被扼杀在摇篮里。

6、MPEG-4

1992 165438+10月，MPEG专家组决定开发一种新的极低比特率音频/视频(AV)编码国际标准，即MPEG-4。对于学术界来说，极低码率(小于64Kbit/s)是视频编码标准的最后一个码率范围。

MPEG-4专家组在深入分析了电视、计算机、通信及其在AV领域的交叉融合的发展趋势后，认为MPEG-4应该提供一种新的通信方式，其核心是基于内容的AV信息的存储、处理和操作，支持交互性、高压缩比和通用存储等功能。同时，其结构应具有适应性和可扩展性，以适应硬件和软件技术的不断发展，并促进新技术的及时集成。

与MPEG的前两个压缩标准相比，MPEG-4不再是简单的视频和音频编解码标准。它以内容和交互性为核心，从而为多媒体提供了更广阔的平台。它定义了更多的格式和框架，而不是特定的算法，因此人们可以向系统中添加许多新的算法。除了一些压缩工具和算法，图像分析与合成、计算机视觉、语音合成等各种多媒体技术也完全可以应用到编码中。

H.261是ITU-T针对可视电话、会议电视、窄带ISDN等要求实时编解码、低时延的应用提出的编码标准。标准包含的比特率为p*64Kbit/s，其中P为整数，取值范围为1 ~ 30，对应的比特率为64 kbit/s ~ 92 mbit/s..

7、H.261

H.261标准分为帧内模式和帧间模式两种编码模式。对于运动适度的头肩图像，帧间编码模式将占主导地位；但对于画面切换频繁或运动剧烈的序列图像，帧间编码模式要频繁切换到帧内编码模式。

为了减少信道误码，采用了一种称为BCH (511，493)的纠错编码方法。这种纠错码可以自动纠正493位中的2位错误。根据H261，信源编码器必须具有纠错编码的功能，纠错编码是可选的。

8、H.263

1995，ITU-T总结了当时世界上视频图像编码的最新发展，制定了低比特率视频应用的H.263标准，被公认为是第一代编码技术基于像素的混合编码方案所能达到的最好结果。随后几年，ITU-T对其进行了多次补充，以提高编码效率，增强编码功能。补充和修订的版本是1998中的h . 263 ++和2000年的h263++。H.263系列标准特别适用于PSTN网络、无线网络和互联网中的视频传输。

H.263已被多个可视电话采用为终端标准，如支持PSTN和无线网络的H.324、支持N-ISDN的H.320、支持B-ISDN的H.310等。H.263信源编码算法的核心仍然是H.261标准中采用的DPCM/DCT混合编码算法，原理框图也与H.261非常相似。

9.MPEG-7和MPEG-21

MPEG-7是用于信息表示的“多媒体内容描述接口”，MPEG-7是“基于语义的表示”。MPEG-7定义了描述各种类型多媒体信息的描述符标准集，相应的描述方案可以用来规范多媒体描述符的生成以及不同描述符之间的有机关系。

这些描述符与指定多媒体对象的内容密切相关，提取对象特征的方法为基于内容和语义的精确检索提供了接口。在此基础上，MPEG-7定义了一种描述定义语言(DDL ),用于指定和生成描述方案，即它希望提出一种新的视频和音频信息的表示方法，既不同于基于波形的表示方法，也不同于基于压缩的表示方法(如MPEG-1和MPEG-2)和基于对象的表示方法(MPEG-4)。这种表示允许对信息的含义进行一定程度的解释，这可以通过设备或计算机解码器来访问。MPEG-7的目的是提供一种标准化的核心技术来描述多媒体环境下的视音频内容，最终使视音频采集像文本采集一样简单方便。

MPEG-7可以描述广泛的多媒体对象，其核心DDL语言将充分吸收现有各种媒体描述语言的特点，实现对多媒体数据的普遍适应性。MPEG-4中提出的基于对象的编码思想将成为多媒体数据库中处理视音频对象的基本手段，包括特征提取、压缩编码等。MPEG-7的多媒体内容描述功能可以提高MPEG-1、MPEG-2和MPEG-4的性能并扩展其功能。

最后，MPEG-7将提供内容的描述，而不是内容本身。它不会取代现有的MPEG标准(MPEG-1、MPEG-2、MPEG-4)，只是对现有的三个标准进行补充。

正在制定的新标准MPEG-21是支持用户通过异构网络和设备透明、便捷地使用多媒体资源的标准。其目的是建立一个交互式多媒体对象，实现多种商业模式，包括版权和交易的自动管理以及对内容用户隐私的尊重。

三、利用国内现有的磁盘驱动技术

1，DVD技术

据调查，许多DVD播放机不能实现真正的AC-3解码功能，而是采用以下方法代替:

1)，简单两个通道。无论光盘上的音频数据是否根据AC-3编码，它都作为两个混合音频通道输出。由于省略了其他四个声道的音频输出，硬件成本大大降低，与真正的杜比AC-3解码相比，向Dobly公司支付专利的成本大大降低，这是一种DVD播放器的低成本方案。这样用户只能听到简单的左右声道效果。如果想享受真正的杜比AC-35.1声道环绕声效果，需要加一个同轴或光纤输入端子的AC-3解码功放，其市场价在2000元左右，也就是再买一台DVD机的价格。

2)两个通道，带六个输出端子。这种方法又称“伪六声道”，实际上只有三组相同的二声道输出，是二声道机的简单复制，无法实现杜比AC-35.1声道的真机相似，往往容易成为正当利益的来源。因此，消费者在购买时应仔细甄别。

3)AC-3信道的虚拟仿真。这样通过一个声场处理芯片，通过叠加、抵消等软件算法模拟出两个声道的音频，类似于AC-35+38+0声道解码输出。杜比AC-35.1声道效果，但由于其音源来自两个主声道，声场的表现力和层次感比真正的AC-3解码差很多，容易混淆观众，侵害消费者利益。

那么，真正的杜比AC-35.1声道解码输出是怎样的呢？杜比AC-3是一种专为多声道数字音频设计的感知编码技术。它结合了声学和先进的数字信号处理技术，具有前所未有的高效率、高质量和多功能性。多声道形式上，杜比AC-3提供五个全音频声道，其排列方式通常被称为3/2结构:三个前置声道(左、中、右)加两个环绕声道，一个低音频效果声道。一般来说就是左前、右前、中置、环绕左、环绕右、重低音，也就是所谓的“5.1”声道。与模拟AC-2(杜比Prologic)相比，杜比AC-3拥有两个完全独立的环绕声道，每个声道都可以提供与前排相同的三个声道的全波段保真音频。所以真正再现以上效果的解码才是真正的杜比AC-35.1声道解码。

2.HDV技术

HD12压缩编码系统是北京凯程高清科技有限公司针对HDV高清数字电影格式的激光多媒体光盘开发的压缩编码系统。该系统采用优化的MPEG-2视频编码格式。它在原有MPEG-2的基础上，采用了重新定义宏块大小、重新设置量化长度、优化熵编码和优化运动补偿的方法。利用半导体领域的最新进展，依托半导体芯片强大的处理能力，实现了更高的压缩比和更好的复原效果。

HD12压缩编码系统依托北京凯程高清科技有限公司技术人员多年的技术积累，历时两年多研发而成。该系统不仅具有高效的实时压缩功能，还能完成图像清晰度处理和修复、字幕和配音生成和叠加等多种编辑功能。

凯程高清科技有限公司研发的HD12压缩编码系统，可以实现高清视频流的高效压缩，为目前高清视频节目的匮乏提供了良好的技术平台，完全可以满足目前高清视频节目的压缩需求，让消费者享受到更多更好的高清视频节目。

HDV播放器可以兼容CD、vcd、DVD，但是普通vcd、DVD上看不到HDV碟片。换句话说，HDV碟片只能搭配HDV高清数字电影播放器。如果没有机器，买回来的碟片就只能相当于一个报废的碟片。

据凯程高清科技有限公司开发商介绍:“由于HDV光盘采用超压缩技术，一张光盘可以存储3-5个高质量的电影节目。目前这项技术在国内只有他们厂家掌握，而且技术是加密的，外人根本偷不到。”

3.EVD科技

郭芙的音频压缩技术始于公司成立之初(2000年3月)，被视为“新一代高密度数字激光视盘系统EVD？”项目中的子课题经历了起步、发展、成熟几个阶段，目前已申请了近20项核心专利技术。这些专利形成了一套具有自主知识产权的基于多分辨率分析的高效音频编码技术方案EAC，在2001年7月江苏省电子产品监督检验院组织的主观音质评价实验中，得到了与会专家的高度评价。

目前EAC编码技术可以提供单声道、双声道立体声、5.1环绕立体声、多采样率、多比特率的编解码方案，编码效率进一步提升，已经成为EVD？标准化音频编码技术标准。

为了进一步提高编码效率，特别是极低比特率下的音频质量，我们在自主开发的同时，还加强了与掌握最先进音频编码技术的国外公司的技术合作。经过长期的技术合作，北京郭芙数字技术有限公司将与拥有世界最先进水平的带宽扩展技术的瑞典-德国编码技术公司成立合资公司，共同开发和推广EAC Plus技术。在EAC技术的基础上，EAC Plus技术将进一步提升中国音频编码技术水平，使中国音频编码技术达到国际领先水平。

我们知道，音频编码技术可以从很多角度进行分类:有损和无损，波形和参数，窄带和宽带，恒定比特率和可变速率。然而，音频编码处理的信号类型可以简单地分为两类:缓慢变化的分量和瞬时变化的分量。当然，从模型的角度来看，可以分为串分量、瞬时分量和噪声分量。因为我们目前专注于波形编码技术，所以不做这个分类。可以说，所有的波形编码技术都在努力寻找一种对慢变和瞬时变都尽可能高效的编码技术，同时保证可接受的编码复杂度。问题的原因在于人耳对不同信号的听觉特性。虽然从理论上讲，人耳对信号的反应是一个非常复杂的生理和心理问题，但在编码的过程中，突出表现为两个矛盾。对于缓变分量，人耳响应的频率分辨率较高，但时间分辨率较低；对于瞬时变化，频率分辨率较低，时间分辨率较高。并且该特性随着不同的信号而变化。较高的频率分辨率对应着较高的编码效率，但同时前回声抑制能力较差；时间分辨率越高，预回声抑制能力越好，但编码效率较低。

在设计和实现的过程中，EAC一直在尝试用更自然的方式对各种音频信号进行处理/编码，这是EAC设计的基本技术路线。具体体现在，EAC一直遵循多分辨率分析机制，力求在统一的滤波框架内对各类音频信号进行更高效的编码。

4.HVD科技

4月28日，国内首个高清影碟产业联盟(简称HVD联盟)在沪隆重成立。清华同方作为国内新一代高清视频播放器的重要制造商和开发商，凭借其在高清DVD领域的巨大影响力，成功成为联盟首批成员。

HVD联盟是由整机厂商、内容提供商、发行商、核心芯片等厂商以及相关高校、科研院所自愿组成的产业联合体，以具有自主知识产权的IC等核心关键元器件和自主研发的整机系统和技术为纽带。联盟的目标是通过产业链的有效整合，推动HVD技术标准、市场和产业有序、高效、持续发展，为中国DVD产业从“制造大国”向“科技强国”转变做出贡献。

联盟的近期目标是发展和推动HVD具有“高清”水平的整机内容和光盘产业，使HVD成为DVD的升级产品。首批“HVD联盟”共有18名成员，主要任务是:建立和保护“HVD”的知识产权机制；联盟内享有知识产权；进行“HVD”标识的授权和格式验证，确保HVD机盘统一；做好光盘加密和防拷贝工作；组织各种技术展示、产品推介会、格式标准会议。

依托自身强大的科研实力，经过三年多的不断探索，清华同方已经成为国内为数不多的掌握高清影碟机技术的厂商。作为清华同方影碟机产品的最新科技代表，不久前，清华同方推出了科技含量最高的DVP-i919 HD DVD，可实现480P、720P逐行扫描，1920*1080i隔行扫描。同时，作为目前DVD的替代产品，i919还支持MPEG4-4电影播放，并设置了USB1.1接口，可与众多数码产品直接交换和查看数据。从公司近期的销售数据来看，清华同方高清产品在市场上获得了不错的反响，与市场上同期推出的EVD、HDV等替代产品并驾齐驱。

此次清华同方成功加入HVD联盟，相信将为其赢得更多引领HD DVD时代的机会，并对HD DVD行业未来的走向产生深远的影响。

HVD是英文高清晰度多功能光盘的缩写。HVD集强大的功能、清晰的图像、低廉的价格、卓越的向后兼容能力、关键技术和自主知识产权于一身。HVD科技已经向国家知识产权局申请了六项发明专利。

HVD支持各种输入格式的接口:1080 I/720 p/576 p/576 I/480 I/VGA/SVGA，符合视频、Y/C、YPbPr高清标准。HVD，水平清晰度和垂直清晰度都达到720线。

HVD可以在一张DVD9大小的CD上存储150分钟的高清电影。

5.FVD科技

当前版本的FVD规范使用650nm红色激光；Na 0.6 ~ 0.65，其物理规格高于DVD容量；单面单层FVD磁盘容量可达5.4 GB ~ 6 GB第一代开始采用8/16作为编码方式，下一代将采用高效的8/15编码方式，提高纠错(ECC)能力。在逻辑规范部分，微软WindowMediaVideo-9(WMV-9 9(WMV-9)视频压缩技术可以容纳135分钟的1280x720p高清节目，其中新开发的高清音视频技术如菜单动态&:动态背景、节目回放、菜单回放、子画面回放、主从回放等。此外，为了保护知识产权，还将提供高级加密标准(AES)内容保护系统的防复制机制。