什么是DSP技术?
Processing——DSP)强调的是利用数字信号处理的理论,在芯片上运行目标程序,实现某种信号处理。
数字信号处理是21世纪科学和工程领域最强大的技术之一。在广泛的领域发生了革命性的变化:通信、医学成像、雷达和声纳、保真音乐再现和原油勘探,只有这些被命名。各个领域的DSP技术都发展到了一定的深度,有了自己的算法、数学和特定的技能。广度和深度的结合,使得任何人都不可能掌握所有发展起来的DSP技术。DSP教育包括两项任务:学习可以应用于整体的概念,学习自己感兴趣的特定领域的专业技能。本章通过描述DSP在几个不同领域带来的巨大影响,开始了我们进入数字信号处理世界的旅程。革命已经开始了。
DSP的根源
数字信号处理不同于计算机科学的其他领域,因为它所使用的数据类型的独特性:信号。在大多数情况下,这些信号来源于现实世界中的感官数据:地震的地震振动、视觉图像、声波等。在信号被转换成数字形式后,DSP就是用来处理这些信号的数学、算法和技术。这包括各种各样的目标,例如增强视觉图像、识别和生成对话(语音)、压缩数据以便存储和传输等等。假设我们给计算机添加一个“对比度-数字转换器”,并用它来检索一些真实世界的数据。DSP回答问题:下一步怎么办?
DSP的起源是在1960和1970年代,当时数字计算机首次出现。这个时代电脑很贵,DSP仅限于一些关键应用。先锋主要集中在四个关键领域:危及国际安全的雷达和声纳,可以赚大钱的原油勘探,不可替代的太空探索和可以拯救生命的医学影像。在1980和1990,个人电脑的革命使得DSP的新应用骤然增多。动机不是出于军队和政府的需要。DSP突然被商业市场驱动。任何一个认为自己可以在快速扩张的领域赚钱的人,突然就变成了DSP厂商。DSP在移动电话、光盘播放器和电子语音邮件等产品中已经变得众所周知。图1-1列出了其中一些应用。
这场技术革命是自上而下发生的。1980早期,电机领域的研究生课程中讲授DSP。十年后,DSP已经成为大学标准课程的一部分。如今,DSP已经成为许多领域的科学家和工程师所需要的一项基本技能。以此类推,DSP可以和之前技术革命中的“电子学”相提并论。虽然仍然是在电子马达领域,但几乎每个科学家和工程师都有一些基本电路设计的背景。否则,他们可能会迷失在技术的世界里。DSP也有同样的未来。
图1-1
DSP革新了科学和工程的许多领域。这里列出了一些不同的应用。
最近的历史更令人好奇;对你学习和使用DSP的能力影响很大。假设您遇到了一个DSP问题,并转向教科书或其他出版物寻求答案。你通常会发现一页又一页的方程式、晦涩难懂的数学符号和陌生的术语。这是一场噩梦!即使对于有这方面经验的人来说,很多DSP文档还是让人摸不着头脑。这在文献中是没有错的,只是期望给非常特定的读者群。目前,发展科学技术的研究人员需要这种复杂(详细)的数学来理解工作的理论含义。
这本书的基本假设是,大多数实用的DSP技术都可以在没有传统复杂数学和理论障碍的情况下学习和使用。《科学家和工程师数字信号处理指南》是为那些想把DSP作为工具而不是新职业的人编写的。
本章的其余部分列出了DSP带来革命性变化的一些领域。当你看每一个应用时,你会注意到DSP是非常跨学科的,依赖于许多相邻领域的技术工作。如图1-2所示,DSP与其他技术学科的界限并不明显,也没有完美的定义,而是模糊和重叠的。如果想专攻DSP,还需要学习一些相关的领域。
图1-2
数字信号处理在科学、工程和数学的许多领域中具有模糊和重叠的边界。
电信(电信)
电信就是把信息从一个地方发送到另一个地方。这包括许多形式的信息:电话交谈,电视信号,计算机文件和其他类型的数据。要发送信息,您需要两个位置之间的通道。这可以是一对电线、无线电广播信号、光纤等。电信公司因传输客户信息而获得报酬,然而,他们必须为建立和维护信道付费。金融书籍的底线很简单:它们通过单一渠道传递的信息越多,它们能赚的钱就越多。DSP在许多领域给电信行业带来了革命性的变化:音频信号的产生和检测、频带偏移、消除电力线嗡嗡声的滤波等等。这里将讨论电话网的三个特殊例子:多路复用、压缩和回声控制。
多路复用(多路复用)
世界上大约有十亿部电话。只要按几个键,交换网络就能让任何地方的任何人在几秒钟内连接起来。这个无限的任务让人犹豫。直到1960,两部电话之间的连接需要通过机械开关和放大器传输模拟声音信号。一个连接需要一对电线。相比之下,DSP将音频转换为串行数字数据流。因为比特可以很容易地交织和分离,许多电话交谈可以在一个信道上传输。例如,电话的标准被称为T-carier系统,它可以同时传输24个声音信号。每个声音信号使用8位压扩(对数压缩)模数转换每秒采样8000次。每个声音信号结果表示为64,000比特/秒,所有24个通道都包含在1.544兆比特/秒中。使用传统的22号铜电话线,信号可以传输大约6000英尺,这是典型的互连距离。数字传输有许多经济优势。电线和模拟开关很贵,数字逻辑门很便宜。
压缩(压缩)
当声音信号以8000样本/秒的速度数字化时,大多数数字信息将是冗余的。换句话说,任何一个样本携带的信息都会被相邻的样本大量复制。已经开发了几十种DSP算法来将数字化的声音信号转换成需要更少比特/秒的数据流。这些被称为数据压缩算法。相应的解压缩算法用于将信号恢复到其原始形式。这些算法在压缩次数和产生的声音质量方面有所不同。一般来说,数据速率可以从64千比特/秒降低到32千比特/秒,而不会损失声音质量。当压缩到8千比特/秒的数据速率时,声音会受到明显的影响,但对于长途电话网还是有用的。可实现的最大压缩约为2千位/秒,导致声音高度失真,但它可以用于一些应用,如军事和潜艇通信。
回声控制(回声控制)
回声是长途电话连接中的一个严重问题。当你对着电话说话时,一个代表你声音的信号传到与之相连的接收器,一些信号会被传输回来,也就是回声。如果链接在数百英里之内,只需要几毫秒就可以接收到回声。人耳习惯于听这些小的延时回声,连接看起来相当正常。随着距离的变长,回声越来越明显,越来越烦人。对于州际通信,延迟可能高达数百微秒,这尤其令人反感。数字信号处理通过测量返回的信号并产生适当的反信号来消除恼人的回声,从而开始处理这样的问题。同样的技术允许扬声器用户同时听和说而不反击(长时间尖叫)。它也可以被数字生成的抗噪声抵消,以降低环境噪声。
音频处理(音频处理)
人类的两种主要感官是视觉和听觉。相应的,很多DSP都与图像和音频处理有关。人们听音乐和语言(发音)。DSP在这两个领域发生了革命性的变化。
音乐(音乐)
从音乐家的麦克风到喜欢播放高级立体声的人的扬声器的路径是相当长的。数字数据表示很重要,因为它可以防止“一般与模拟存储和处理有关”的退化。任何比较过卡带和CD音乐质量的人都会熟悉这一点。在一般情况下,音乐剪辑在录音室中录制在几个通道或轨道上。在某些情况下,这甚至包括单独录制单个乐器和歌手。这样做是为了让音响工程师在制作最终产品时有更大的灵活性。将单个轨道组合成最终产品的复杂过程称为混音。DSP在混音时可以提供几个重要的功能,包括:滤波、信号加减、信号编辑等。
注意:将X声道音频混成Y声道,其中X是大于Y的数,比如你的DVD有5.1个声道,但你只有耳机,而耳机只有两个声道,所以你需要向下混成2个声道。感谢绝地的讲解。
DSP在音乐准备中最有趣的应用之一是人工混响。如果单个声道简单地加在一起,产生的片段听起来很脆弱,很像音乐家在户外演奏。这是因为听众受到音乐回声或余味的影响很大,这种影响通常在录音室里被最小化。DSP允许在mix down中总结人工回声和余味,以模拟各种理想的听音环境。延迟数百微秒的回声给人一种教堂般的感觉。以10-20微秒的延迟增加回声,使人感觉处于更合适的听音空间。
语音生成(语音生成)
语音的产生和识别被用来作为人机之间的交流。不是用你的手和眼睛,而是用你的嘴和耳朵。当你的手和眼睛应该做其他事情的时候,比如开车,操作手术,或者(不幸地)用武器向敌人开火,这是非常方便的。对于计算机生成的声音,将使用两种方法:数字录音和声道模拟。在数字录音中,人声被数字化并存储,通常是以压缩的形式。在录制和回放期间,存储的数据被解压缩并转换回模拟信号。录了整整一个小时的语音只需要3兆左右就可以存储,即使是在小型计算机系统中。这是当今最常用的数字语音生成方法。
声道模拟更复杂。我们试图通过建立人声来模仿身体的物理机制。人体声道模拟是一个声腔,其共振频率由腔的大小和形状决定。相比较而言,摩擦音来源于狭窄压缩下嘈杂的空气噪音,就像牙齿和嘴唇一样。信道模拟通过产生模拟这两种刺激的数字信号来工作。共振腔的特性是通过用类似* * *振动的数字滤波器传输激励信号来模拟的。这种方法被用在一个非常早期的DSP成功案例中,Speak & amp;Spell是一款畅销的儿童电子学习辅助工具。
语音识别
自动人类语音识别比语音生成更困难。语音识别是人脑做得很好,但数字计算机做得很差的经典例子。数字计算机可以存储和记忆非常大量的数据,以非常快的速度进行数学计算,并进行重复的工作,而不会感到厌烦或效率低下。不幸的是,当面对原始的感官数据时,今天的计算机表现很差。教计算机每月给你送一份账单是很容易的。教同一台计算机理解你的声音是一个大工程。
数字信号处理通常分两步处理语音识别:特征匹配后的特征提取。
应首先隔离输入音频信号中的每个单词,然后进行分析,以识别刺激类型和振动频率。然后将这些参数与以前说过的单词的例子进行比较,以识别最接近的一对。通常,这些系统仅限于几百个单词,并且只能接受单词之间有明显中断的语音;每个演讲者都需要单独接受再培训。虽然这适用于许多商业应用,但与人类听觉相比,这些限制就相形见绌了。在这个领域有很多工作要做,那些在商业产品上成功的人将会得到丰厚的回报。
回声定位
获取远程对象信息的一个常见方法是弹出一个波。例如,雷达通过发射无线电波的脉冲波并检查从飞机回波接收的每个信号来工作。在声纳上,声波通过水传播来探测潜艇和其他水下物体。地球物理学家通过设置长期爆破和倾听深埋岩层的回声来精确定位地球。虽然这些应用程序有相同的线程,但它们都有自己特定的问题和需求。数字信号处理在三个领域产生了革命性的变化。
雷达(雷达)
雷达是无线电探测和测距的缩写。在最简单的雷达系统中,无线电发射机产生一个几微秒长的射频能量脉冲。这种脉冲被送入高定向天线,无线电波在那里以光速传播和离开。这个波路上的平面会将一小部分能量反射回发射站附近的接收天线。通过发射脉冲和接收回波之间的时间来计算到物体的距离。物体的方向更容易找到。当接收到回声时,你知道你指向定向天线的位置。
雷达系统的作用距离由两个参数决定:初始脉冲中有多少能量和无线电接收机的噪声水平。不幸的是,通常需要更长的脉搏波来增加脉搏波中的能量。于是,较长的脉搏波降低了消耗时间测量的精度和准确度。这导致了两个重要参数之间的冲突:探测远处物体的能力和正确确定物体距离的能力。
DSP有三个领域的革命性雷达,都和基础问题有关。首先,DSP可以在接收到脉冲波后对其进行压缩,从而在不减小其工作范围的情况下提供更好的距离测量。其次,DSP可以滤除接收信号,降低噪声。这在不降低距离测量的情况下增加了范围。第三,DSP可以快速选择和产生不同的脉冲波形和长度。其中,这允许针对特定的检测问题优化脉搏波。现在是令人印象深刻的部分:它们中的许多是基于类似于所用无线电频率的采样率,大约是数百兆赫!就雷达而言,DSP与高速硬件设计高度相关,就像它与算法高度相关一样。
声纳
声纳是声音导航和测距的缩写。分为主动和被动两类。在主动声纳中,2 kHz到40 kHz之间的声音脉冲波被发射到水中,检测并分析结果的回波。使用主动声纳包括:探测和定位水下物体、导航、通信和绘制海底地图。一般最大运行里程为10至100公里。相比之下,被动声纳只听水下声音,包括自然湍流、海洋生物和潜艇及水面舰艇的机械声。因为被动声纳不会消除能量,所以非常适合转换操作。你想发现另一个人,又不想让他发现你。被动声纳最重要的应用是军事监视系统,用于探测和跟踪潜艇。被动声纳通常比主动声纳使用更低的频率,因为它们在水中传播时吸收更少。探测范围可达数千公里。
DSP在声纳和雷达方面有很多革命性的发展:脉冲波产生、脉冲波压缩、检测信号滤波。有一种观点认为声纳比雷达简单:因为它包含的频率更低。另一种观点认为,声纳比雷达更难,因为环境更不一致,更不稳定。声纳系统通常使用昂贵的阵列来发射和接收元素,而不仅仅是单个信道。通过适当地控制和混合这些许多元件的信号,声纳系统可以将消除的脉冲波引导到期望的位置,并确定接收回波的方向。为了处理这么多的信道,声纳系统需要像雷达一样大的DSP计算能力。
反射地震学(反射地震学)
大约在1920年代早期,地球物理学家发现可以通过声音探测到地壳的结构。探险者可以引爆并记录地表下十多公里处边界层的回波。这些回波被肉眼解释为对应于地下的结构。反射地震法很快成为确定石油和矿藏位置的主要方法,至今仍然如此。
在理想情况下,传输到地面的声音脉冲波会从每个脉冲波经过的边界层产生回波。不幸的是,情况通常没有这么简单。每一个返回地面的回波都必须穿过所有其它的上边界层。这将导致回声从一层跳到另一层,产生回声的回声将在表面上被检测到。这些二次回波会使检测到的信号非常复杂,难以解释。自1960年代以来,数字信号处理已被广泛用于从反射地震记录中分离主回波和次回波。早期的地球物理学家在没有DSP的情况下是如何处理的?答案很简单:他们着眼于多重反射最小化的简单地方。DSP允许在困难的位置发现原油,例如在海底。
图像处理(图像处理)
图像是特征信号。首先,它们是空间(距离)中参数的度量,尽管大多数信号是时间参数的度量。其次,它们包含了大量的信息。例如,存储一半的电视视频可能需要超过10兆字节。这比类似长度的声音信号大1000倍以上。第三,最终质量的判断一般会受限于人的评价,而不是客观的评价标准。这些特征使得图像处理在DSP内分成不同的子组。
医疗(医学)
1895年,威廉康拉德R?Ntgen发现X射线可以穿透相当多的实际物体。医学已经取得了革命性的进步,因为它能够看到活的人体内部。仅仅几年时间,医用X射线系统就已经遍布全球。尽管取得了明显的成功,但医学X射线图像受到四个问题的限制,直到1970年出现了DSP和相关技术。第一,人体内的重叠结构可以隐藏在另一个结构后面。例如,肋骨后面的心脏部分可能不可见。其次,并不总是能够区分相似的组织。例如,也许可以将骨骼与软组织分开,但不能将肿瘤与肝储库区分开来。第三,x光图像显示的是解剖学,即身体的结构,而不是生理学,即身体的运作。活人的x光图像看起来像死人的x光图像!第四,暴露在X射线下会导致癌症,所以应该谨慎使用,并且只有在适当的情况下才使用。
通过在1971中引入第一台计算机断层扫描仪(官方命名为计算机轴位断层扫描仪或CAT扫描仪)解决了重叠结构的问题。计算机断层扫描(CT)是数字信号处理的经典例子。在对病人进行检查时,来自多个方向的x射线会穿透病人身体的各个部位。信号被转换成数字数据并存储在计算机中,而不是简单地用检测到的X射线形成图像。该信息然后用于计算要显示为身体切片的图像。这些图像显示了比传统技术更多的细节,允许更好的检测和治疗。CT的影响几乎和原始x光图像本身一样大。几年之内,世界上每一家大医院都使用了CT扫描仪。在1979中,CT原理的两位贡献者,戈弗雷·N·亨斯费尔德和艾伦·M·科马克,* * *获得了诺贝尔医学奖。那是个不错的DSP!
后三个X射线问题已经通过使用X射线之外的穿透能量解决了,比如无线电和声波。DSP在所有这些技术中起着关键作用。例如,磁共振成像(MRI)利用磁场和无线电波来检测人体内部。适当调整磁场强度和频率,使体区原子核能在量子能态之间振动。这种振动会导致二次无线电波发射,由靠近身体放置的天线检测到。该检测到的信号的强度和其他特征提供了关于* * *振动的局部区域的信息。磁场的调整使这个物体扫描的振动区域与内部结构相对应。这些信息通常被表示为图像,就像计算机断层扫描一样。除了提供不同类型软组织之间的出色识别之外,MRI还可以提供关于生理学的信息,例如通过动脉的血流。MRI完全依赖于数字信号处理技术,没有它就无法实现。
外层空间(太空)
有时候,你必须充分利用一张糟糕的照片。这通常是因为图像是从无人卫星和太空探索火箭上拍摄的。没有人会派一个修理工去火星只是为了转动相机的旋钮!DSP可以使用几种方法来提高在非常不合适的条件下拍摄的图像的质量,它们是:亮度和对比度调整、边界检测、降噪、焦点调整、减少运动模糊等等。具有空间失真的图像,例如在拍摄球形行星的平面图像时遇到的那些,可以被扭曲成正确的表示。许多独立的图像可以合并到一个数据库中,这样信息就可以以一种独特的方式显示。例如,一个电视图像序列模拟了一架在不同星球表面飞行的飞机。
商业成像产品(商业成像产品)
对于大量出售给公众的系统,图像中的大量信息内容是一个问题。商用系统一定要便宜,这不是大量内存和高数据传输率的结果。这个定理的一个解决方案是图像压缩。就像声音信号一样,图像包含大量冗余信息,可以通过减少需要表示的位数的算法传输回来。电视和其他动作电影特别适合压缩,因为大多数图像从一帧到另一帧都是一样的。商业图像处理软件使用这种技术,包括:可视电话、显示运动图像的计算机程序和数字电视。