数字化音频的历史

数字技术的出现和应用给人类带来了深远的影响。人们现在生活在一个几乎数字化的世界，数字音频技术是应用最广泛的数字技术之一。CD、VCD等。已经走进了千家万户，数字广播正在全球范围内逐步开展。正是这些与消费者息息相关的产品和应用，成为了本文要介绍的主题:数字音频压缩技术产生和发展的驱动力。

1，音频压缩技术的出现和早期应用

音频压缩技术是指对原始数字音频信号流(脉码调制)应用适当的数字信号处理技术，在不损失有用信息或损失可忽略不计的情况下，降低(压缩)其比特率，也称为压缩编码。它必须有相应的逆变换，称为解压缩或解码。音频信号在通过编解码器系统后可能会引入大量噪声和一些失真。

数字信号的优点是显而易见的，但它也有自己相应的缺点，即存储容量要求的增加和传输时信道容量要求的增加。以一张CD为例，采样率为44.1KHz，量化精度为16位，那么1分钟的立体声音频信号需要占用大约100字节的存储容量，也就是说一张CD转盘的容量只有1小时左右。当然，这个问题在带宽高得多的数字视频领域更为突出。这些位都有必要吗？发现用PCM码流直接存储和传输有很大的冗余。实际上声音至少可以4: 1无损压缩，也就是只用25%的数字量保留全部信息，在视频领域压缩比甚至可以达到几百倍。因此，为了利用有限的资源，压缩技术自出现以来就受到了广泛的关注。

音频压缩技术的研究和应用由来已久。比如A律和U律编码就是简单的准瞬时压扩器，已经应用在ISDN语音传输中。对语音信号的研究发展较早，也比较成熟，并得到了广泛的应用，如自适应差分PCM(ADPCM)、线性预测编码(LPC)等技术。在广播领域，音频压缩技术用于NICAM(近StantaneousCompandedaudiomultiplex)等系统。

2.音频压缩算法的主要分类和典型代表。

一般来说，音频压缩技术可以分为无损压缩和有损压缩两大类，而根据压缩方案的不同，又可以分为时域压缩、变换压缩、子带压缩，以及各种技术的混合压缩。不同的压缩技术在算法复杂度(包括时间复杂度和空间复杂度)、音频质量、算法效率(压缩比)、编解码延迟等方面都有很大的差异。各种压缩技术的应用也各不相同。

(1)时域压缩(或波形编码)技术是指直接对音频PCM码流的样本进行处理，通过静音检测、非线性xing量化、差分等手段对码流进行压缩。这类压缩技术的共同特点是算法复杂度低，音质一般，压缩比低(CD音质>；400kbps)，编解码延时最短(与其他技术相比)。这种压缩技术一般用于语音压缩和低比特率应用(小源信号带宽)。时域压缩技术主要有G.711，ADPCM，LPC，CELP，以及块压扩器如NICAM和子带ADPCM(SB-ADPCM)技术如G.721，G.722，Apt-X等。