MPEG降噪是什么意思?
视频压缩和MPEG降噪技术
理论上,数字电视(DTV)的画质比传统模拟电视要好,不存在鬼影、雪花、震颤、色彩失真等问题。而且可以论证的是,模拟电视信号最大的缺陷就是画面上斑点多,对高频信号响应不够,画面不够细腻,总之就是带宽不够。图像越精细,分辨率越高,所需的带宽也越大。
很久以前,美国官员将可用频谱中的每6MHz带宽分配给ABC的每个频道,以提供模拟电视信号。这种对视频带宽的限制及其相应的显示标准(NTSC色彩空间)决定了几十年来传统电视机的特性和电视图像的质量。
随着数字电视的出现,广播公司看到了充分利用分配给他们的带宽的机会。的确,从他们的角度来看,数字电视最突出的优势是允许在相同的带宽内传输更多的频道,还可以支持后续的高清电视节目(HDTV)。
冗长的数据
高清电视对技术要求非常高。传统的传播模拟信号的NTSC信号,在6MHz的信道带宽内,应使用4.2MHz的最小带宽,以29.97Hz的场频扫描525行,经过数字量化和编码压缩后,信号可以记录在DVD上,其比特传输速率从2Mbits/s到10Mbits/s(自适应),平均为4 mbits/s,相比之下,典型的HDTV的分辨率是模拟电视的5倍。
因此,在同等条件下,传输数据速率应该是模拟信号的5倍,才能达到同样的性能。
无论是传统的空中广播(OTA)、有线电视公司的机顶盒还是卫星电视,在传输信号时都受到带宽的限制。在有限的带宽上,他们不得不附加占用带宽的服务,包括互动广播、付费频道和电视节目单。
那么,如何才能解决问题呢?使用压缩技术是一种方法。
数字视频压缩会导致失真。
目前,最常用的数字视频压缩算法是MPEG-2。从现有的卫星电视传输、有线数字电视传输到空中数字广播,MPEG-2已经在国际上广泛应用于各种应用中。
MPEG-2首先通过运动补偿去除时间冗余,然后将一帧图像划分为8×8的像素点阵,在每个点阵中使用DCT(离散余弦变换)去除空间冗余。DCT完成后,通过量化和再压缩,然后变长编码,最后霍夫曼编码来完成。整个压缩过程大大降低了比特率(>:10:1压缩比),然而比特率的降低也带来了问题,因为编码丢失了一些原始的视频信息,可能会造成严重的负面影响,所以MPEG-2称为有损编码。它丢弃视觉上被认为不太重要的图像信息。压缩率越大,编码图像和原始图像之间的差异就越大。图像质量和保真度现在取决于选定的(或通常应用的)压缩级别。因为直接关系到可用带宽,所以我们一定要问自己,什么时候才会没有过度的视频压缩?
可见失真
数字信号传输中的带宽限制和过度图像压缩使得压缩图像与模拟世界中看到的图像完全不同。
通常模拟图像退化(或噪声)往往以高斯噪声的形式出现,其优点是会保留基本内容,不易被人的视觉缺陷所察觉。我们经常会看到一些有些模糊不清、让人不舒服的模拟图像,但这并不会让人产生明显的厌恶感。
数字噪声遵循着不同的分布模式,更重要的是,其特殊的形式让人在视觉上感到不自然。当MPEG-2编码(或任何基于DCT模块的编解码)被使用到极限时,失真的方式主要有两种:蚊式噪声和块效应。
蚊子噪音和吉布斯效应
蚊子噪音
蚊子噪声在突出的物体、计算机模拟物体或清晰彩色背景上的滚动字符周围最为明显。看起来像是某种朦胧的东西或物体与背景之间高频边界周围的闪光(前景物体与背景之间的锐跳),有时甚至会被误认为是环绕。不幸的是,这种微妙的影响也可以在更接近自然的形状中看到,比如人体。
VIRIS项目组(视频参考损伤系统)将蚊子噪音定义为“伴随着运动物体边缘的扭曲,表现为物体周围有一层类似飞行物体和/或模糊气泡的物质(就像蚊子在人的头和肩膀周围飞行一样)”。
当重建图像并且由于使用反余弦变换而丢弃一些数据时,会出现蚊式噪声。“蚊子”也可以在图像的其他部分找到,例如,蚊子噪声也可以出现在特定的纹理边界或颗粒状对象上。结果有点类似于随机噪点,好像混了纹理或者粒子,看起来像是图片的原始特征。
方块效应
方块效应,名副其实,在图像中表现出令人讨厌、不自然的方块。有时会出现大块,这是一种图像失真,是由块编码结构造成的。
当编码最大化时,每个像素点阵将被粗略平均,使其看起来像一个大像素。每个像素点阵的计算都不一样,导致点阵有明显的边界。
当物体或相机快速移动时,这种效果更明显。最好的例子就是在NFL(美国国家橄榄球联盟)转播期间,带球奔跑的球员看起来就像老任天堂游戏机里的Maglio兄弟。
预平滑
虽然预平滑不是图像压缩处理算法之一,但它已被用于消除这种数字失真。
广播公司和内容提供商已经越来越意识到其传输系统的缺陷,其中一些已经采用了一种颇有争议的解决方案来解决现有的带宽限制:预平滑。
通过在信号输入通道之前消除图像中的高频部分,编码器有更多的时间来处理其任务,生成的图像受块效应和蚊式噪声的影响较小。另一方面,这种
某种程度上,过度的过滤也会丢失原始图像中所有细微的变化和纹理。
例如,一个留了一周胡子的足球运动员现在看起来像一个干净的胡子(即使他是静止的),而体育场看起来像一个大的绿色地毯。
可以证明,虽然有人认为预平滑也不错,但它是一种不可逆的算法。细节一旦处理,人就无法重建了。
但是,方块效应和蚊子噪音确实消失了。
MNR:铝榴石
公司解决方案
从学术角度来看,人们对图像压缩和校正做了大量的研究,但到目前为止,面向最终用户的实用解决方案并不多。
Algolith是最早提供实时解决蚊子噪音和区块效应的公司之一。Algolith的产品是MNR(MPEG降噪器-MPEG噪声消除器)。
MNR实现了四种独特的图像处理技术:
1-每个像素的实时回归降噪。
2-使用巧妙的分组技术来减少蚊子噪音
3-基于DCT压缩,通过检测、混合和逐渐减少网格来减少块效应。
4-利用非线性滤波实现图像音量调节。
MNR的精髓在于它的空间图像分析模块。每个像素被定义在不同的区域,例如边缘、纹理、平面或相交区域。MNR也关注运动图像的瞬时状态。在考虑了所有这些因素后,MNR将从各种过滤器中选择一个来应用。
MNR独特的适用性使其成为一种先进的图像处理系统。MNR可以在有问题的特殊区域运行,而不会影响画面的其他部分。知道何时何地使用过滤器与何时何地不使用过滤器同样重要。正是基于这种想法,MNR被设计出来。因此,MNR仅用于增强观看体验,并且特别适用于大屏幕显示器和投影显示器。
它的高度自适应特性还允许在不重建已建立的广播基础设施的情况下提高图像质量。MNR的设计一直考虑实时实现和硬件可行性,因此可以无缝植入终端用户现有的家庭影院设备中。
蚊子噪音(左)由Algolith公司的MNR技术处理(右)。
块效应(左)采用Algolith公司的BAR技术处理(右)。
显示技术的发展
曾经,NTSC标准代表了显示领域的标准。模拟电视多年来一直保持同样的分辨率,在提升视觉质量上没有实质性的进步。目前由于政府主管部门没有强制执行新的数字电视标准,无论好坏,普通电视的标准一直在不断提高。
分辨率标准的提高永无止境。随着新兴显示技术(LCOS、DLP等)的快速发展。),一些新的显示器现在可以超过信号的最大分辨率。更重要的是,新显示器的对比度更高,达到了几年前无法想象的大屏幕。
这些都对提高图像质量提出了更高的要求,因为它们充当了那些干扰和失真的放大镜。
随着显示技术的不断进步,原始图像信号校正方案,如Algolith公司专有的MNR技术,将更具吸引力。
尽可能使用SD DVD,直到HD尘埃落定。
向数字世界的转移不仅体现在广播电视行业,在全数字DVD视频(数字通用光盘)(如果不是全部的话)面前,老式的家庭录像带系统也将加速走向灭亡。然而,即使是这种技术在压缩的要求下也是不安全的。
的确,增加新的内容、延长影片时间和多声道音频轨道会使已经包含大量内容的光盘播放不太清晰。因为添加了更多的内容,所以磁盘空间将会不足,并且必须提高压缩率。于是,消费者开始抱怨效果不清晰,这就促使了“超级内容”DVD的出现,它专注于如何最大化光盘所能容纳的电影内容。
来自DVD出版行业的这一行动,不仅印证了压缩可能存在的缺点,也表明了大众对它的理解。因此,普通的DVD媒体可能受益于进一步的视频处理,例如Algolith公司的MNR解决方案。NHR允许现有一代媒体继续存在,直到我们等到蓝光、HD DVD和HVD之战的赢家。
未来前景
新格式战争的赢家专注于提供具有最高视觉质量的高清内容,这当然是现有DVD技术无法做到的。此外,除了现有的编码和解码技术之外,这些新格式还将包括下一代编码和解码技术:
MPEG-2,一种常见的高清方案。
VC-1,MPTE标准421M的非正式草案,基于微软的Windows Media Player (WMV)技术。
MPEG-4/AVC a.k.a. H.264是最有前途的编解码方案。
但这些涉及版权问题的不同标准,可能会导致类似DTV启动时的混乱。最终的图像质量会受到怎样的影响还有待观察。
编解码器越好,用户需求越高。
数字电视和高清电视一开始似乎是画质的“圣杯”,但现实是,我们的画质要彻底转型还为时过早。压缩的需求本身带来了一些问题,而随着更好的显示技术的出现,这些问题对于普通电视观众来说会更加明显。
整个行业都认识到视频带宽有限的严峻现实,作为下一代解决方案的编解码效率的提升显示了提升图像质量的潜力。然而,由于未来似乎被不断增长的带宽需求所主导(IPTV增加了交互性和内容定制),人们可能会问,仅在压缩技术方面的创新能否满足消费者的期望?
随着现实与需求的差距越来越大,开发更好的视频处理算法将成为未来追求高清显示的另一个战场。