数字化音频的历史

数字化音频的历史

数字技术的出现和应用给人类带来了深远的影响。人们现在生活在一个几乎数字化的世界,数字音频技术是应用最广泛的数字技术之一。CD、VCD等。已经走进了千家万户,数字广播正在全球范围内逐步开展。正是这些与消费者息息相关的产品和应用,成为了本文要介绍的主题:数字音频压缩技术产生和发展的驱动力。

1,音频压缩技术的出现和早期应用

音频压缩技术是指对原始数字音频信号流(脉码调制)应用适当的数字信号处理技术,在不损失有用信息或损失可忽略不计的情况下,降低(压缩)其比特率,也称为压缩编码。它必须有相应的逆变换,称为解压缩或解码。音频信号在通过编解码器系统后可能会引入大量噪声和一些失真。

数字信号的优点是显而易见的,但它也有自己相应的缺点,即存储容量要求的增加和传输时信道容量要求的增加。以一张CD为例,采样率为44.1KHz,量化精度为16位,那么1分钟的立体声音频信号需要占用大约100字节的存储容量,也就是说一张CD转盘的容量只有1小时左右。当然,这个问题在带宽高得多的数字视频领域更为突出。这些位都有必要吗?发现用PCM码流直接存储和传输有很大的冗余。实际上声音至少可以4: 1无损压缩,也就是只用25%的数字量保留全部信息,在视频领域压缩比甚至可以达到几百倍。因此,为了利用有限的资源,压缩技术自出现以来就受到了广泛的关注。

音频压缩技术的研究和应用由来已久。比如A律和U律编码就是简单的准瞬时压扩器,已经应用在ISDN语音传输中。对语音信号的研究发展较早,也比较成熟,并得到了广泛的应用,如自适应差分PCM(ADPCM)、线性预测编码(LPC)等技术。在广播领域,音频压缩技术用于NICAM(近StantaneousCompandedaudiomultiplex)等系统。

2.音频压缩算法的主要分类和典型代表。

一般来说,音频压缩技术可以分为无损压缩和有损压缩两大类,而根据压缩方案的不同,又可以分为时域压缩、变换压缩、子带压缩,以及各种技术的混合压缩。不同的压缩技术在算法复杂度(包括时间复杂度和空间复杂度)、音频质量、算法效率(压缩比)、编解码延迟等方面都有很大的差异。各种压缩技术的应用也各不相同。

(1)时域压缩(或波形编码)技术是指直接对音频PCM码流的样本进行处理,通过静音检测、非线性xing量化、差分等手段对码流进行压缩。这类压缩技术的共同特点是算法复杂度低,音质一般,压缩比低(CD音质>;400kbps),编解码延时最短(与其他技术相比)。这种压缩技术一般用于语音压缩和低比特率应用(小源信号带宽)。时域压缩技术主要有G.711,ADPCM,LPC,CELP,以及块压扩器如NICAM和子带ADPCM(SB-ADPCM)技术如G.721,G.722,Apt-X等。