人机交互的前沿发展

自1946第一台计算机ENIAC问世以来,计算机领域出现了多种新技术和新产品,有些是“经久不衰”,有些是“昙花一现”。总结它们兴盛和衰落的原因,可以得出一个规律,所有有助于缩小人机差距,有助于建立和谐人机环境的理论、方法、技术和产品都具有。例如,大规模并行处理、多媒体、开放系统、面向对象、网络计算和嵌入式计算等。,因其在建立和谐人机环境方面的显著成就,成为当今的主流技术。所谓建立和谐的人机环境,绝不仅限于设计和实现友好的人机界面,具有灵活的交互功能。其终极目标是:从计算机应用过程中知识的增加到计算机应用过程中功能的优化;从电脑系统里?quot一开始理解人的意图”逐渐发展成计算机系统,可以“体贴入微”。一开始,用户追求的是“更快、更高、更全”的电脑。然而,随着信息技术的发展和信息应用系统的普及,用户已经致力于寻求更多“易用、适用和易于使用”的计算机。希望在与计算机“共事”的过程中,计算机逐渐了解用户的需求、爱好和水平,用户和计算机的“知识”共同成长。“人机智能共增”的技术水平和应用成果,是计算机技术和人工智能技术发展到新阶段的重要标志之一。在以计算机或准计算机为核心的电子产品时代,人机交互技术正成为各国研究的重点之一。所谓人机交互技术,是指利用人类自身的语言、文字、图像等,使人与计算机进行交流的技术。人机自然语言(语音)交流是其中比较有潜力的一种。由于能够理解人类自然语言的计算机智能是新一代计算机的重要特征,人机自然语言交互技术相关课题的研究是计算机、人工智能和信号处理研究的热点,难度很大,无论是理论还是实验。从芝麻开门的古老传说开始,人类就一直幻想着用语言来征服和改造自然。随着新技术的不断发展,人类的这一梦想正在逐步实现。谁能预测中文语音识别技术会给我们带来怎样的应用前景?随着信息时代的到来,电脑已经成为人类不可或缺的日常工具。在计算机中,人机交互界面通常以键盘为主。为了让计算机界面对人更加“友好”,科学家们开发了几种易学易操作的界面。最方便自然的界面就是口语。基于语音识别,铣杉磨白,挥舞均匀?你怎么了?新闻集团被称为命运之母是真的吗?做饭呢?你为什么不停止付款?有什么意义?谴责?熊?quot五年后,95%的网络软件将由语音完成。“近年来,语音识别与合成技术发展迅速,其相关的语言学、语音学、语音理解、听觉心理学、语言感知等也取得了长足的进步。此外,超大规模集成电路、计算机、数字信号处理和人工智能的快速发展,以及近两年互联网的快速增长和全球信息基础设施建设的热潮,为人机语音对话的研究提供了更好的理论和物质基础和需求牵引。科学家指出,人机语音对话正处于突破的前夜,估计10年会有重大突破,并得到广泛应用。人机语音技术主要包括两个方面,即语音识别和合成。一般来说,语音可以分为声母和韵母。计算机接收到来自口腔的声振动信号后,将声母和韵母进行划分,然后根据信号中声母和韵母的不同空间和参数进行处理,并根据事先在计算机中建立的各种模型进行匹配,从而计算出实际输入波形和模型之间的中心距离,最终得到一系列用符号表示的信号序列。这些任务仅仅完成了语音识别的第一步。众所周知,语音信号往往是歧义的,可以归纳为五种歧义:语音歧义、音义词转换歧义、多义词歧义、语义切分歧义和指称歧义。在语音交流过程中,人类大脑具有解决上述歧义的天然能力,因此人类可以从模糊的语音中清理出语音所包含的信息。通俗地说,这就是理解。要通过计算机来理解,就要教会计算机理解模糊的能力,这个比较难。科学家对此做了大量研究。近日,中国科学院声学研究所研究员黄增阳提出,基于自然语言的理解?quot概念层次网络理论”。这一理论的出现立即引起了国内计算语言领域的关注。一些著名学者称之为创新成果,认为随着这一理论在计算机上的实现,对计算机自然语言的理解将会有重大突破。根据这一理论,中国科学家设计了计算机可读的符号系统,建立了具有中国特色的知识库。知识库包含了内容极其丰富、内部逻辑关系严密的网络结构语义信息,同时设计了包括单字感知、语义块感知、句类判断、上下文生成、隐藏知识揭示等处理模块。形成具有一定人工智能水平的计算机自然语言理解系统。计算机语音合成,即文语转换系统,是将计算机中以文字形式存在的语言文本转换成语音,并通过语音播放出来的系统。它的目标是使计算机具有和人类一样的说话能力,即在合成语音的质量、识别和阅读文本信息的能力以及对抑扬顿挫的掌握等方面满足正常语言交流的要求,并被大多数听者所接受。文语转换与语音识别、语言理解一起,还可以广泛应用于稿件校对、计算机辅助教学、自动电话查询、盲人阅读等方面。近年来,汉语文语转换技术取得了很大进展。由于采用了新的语音合成技术,深入研究了汉语的声学特性,建立了韵律调节规律,明显提高了新的汉语文语转换系统的语音合成质量。为了使计算机合成的语言具有高清晰度和自然度,我们还必须解决文语转换中“文本处理”的智能化问题,即将现有系统中的静态韵律模型变为由与上下文相关的语义控制的动态模型,将特殊条件下的人工韵律标注变为自动机器标注,包括语言间的自动确认、重音、停顿或连续性以及文本中其他韵律特征的自动标注。为了实现这个目标,计算机必须完全理解文本中的每一句话。计算机自然语言理解系统也可以解决这个问题。该系统可以为韵律处理和语音合成提供各种处理信息,解决多音字的发音和歧义切分问题,给出正确的语义块结构,自动生成轻重缓急停顿等韵律信息,从而提高合成语音的准确性和自然度。目前国外比较完善的文语转换系统的文本处理大多是通过语法分析或者统计分析对文本进行一定程度的理解。对于无法提取韵律信息的人,只能手动添加韵律符号。基于语义理解的韵律处理是保证合成语音自然度的关键。韵律处理包括两个方面:一是根据文本内容描述合成语音的韵律特征,如确定哪里要强调,哪里要经过,哪里要放慢语速,哪里要加快语速,哪里要有短停顿,哪里要有长停顿等。第二是?quot将“强调”、“忽略”、“加速”、“减速”、“暂停”等韵律描述信息转化为相应的音高、音长、声强等声学参数,发送给合成模块,使合成的语音具有合适的节奏和韵律。解决韵律控制问题有两种方法:一种是利用知识,另一种是利用统计模型。目前,科学家们正在努力将自然语言理解支持的汉语语音识别和语音合成的计算机人机语音对话系统做成面向用户的适销对路的产品,但目前还有大量的工作要做,尤其是基于概念层次网络的知识库的建立,需要大量的人力物力。来源恐惧?主管?战英?⒐槟城伞⒄?⑸ ⒙ ⒙ ⒙ ⒙ ⒙ ⒙ ⒙ ⒙ ⒙ ⒙ ⒙ ⒙ ⒙ ⒙ ⒙ ⒙ ⒙ ⒙ ⒙ ⒙ ⒙ ⒙ ⒙ ⒙ ⒙ ⒙ ⒙?哎?腿部谎言?有什么不好?啊?威胁是什么?住房提示被雇佣?你怎么了?直之?机械人,8岁?何必呢?低洼?泡芙?你怎么了?⿏ㄈㄈㄈㄈㄈㄈㄈㄈㄈㄈㄈㄈㄈㄈㄈㄈㄈㄈㄈㄈㄈㄈㄈㄈ12·克里夫打电话来了吗?你知道用你的手做什么吗?quot佳音的文语转换系统已经组装在微机上,可以模拟男女老幼不同的声音,用“普通话”和“粤语”朗读。虽然该系统目前不具备“理解”能力,但其声音清晰自然。此外,自然语言理解技术的突破不仅可以应用于计算机人机语音对话,其更大的应用将是人工智能中更有意义的领域——机器翻译。人类梦想用机器代替翻译员全自动翻译自然语言的那一天一定会到来。