中国汉字输入法的三个阶段是什么?

发展历史

中文(汉字)输入法从20世纪80年代到今天发展了近30年,尤其是吴彼和拼音发展很快,尤其是21世纪。具有一定智能程度的拼音输入法,结合拼音易学、词汇量大、为用户设计周到的特点,受到了用户的喜爱,为互联网时代的普及做出了重要贡献。以下文章(2000)输入法,中国人的一道坎?曾几何时,中国人说起电脑,离不开“中国人”这个词。掰着指头算,在中国IT届依然叱咤风云的人物,都不是从“中国人”开始的:联想、巨人靠汉卡,四通靠中文打字机,方正靠中文印刷排版,中星、新浪靠中文平台,等等。在中文领域,最基本的问题是汉字的输入和输出。谁能解决好,谁就赢得商海之战。事情看起来这么简单,解决了投入产出问题就能赚大钱?这么幼稚的结论恐怕是10年前想出来的。虽然有“当代毕升”之称的王选在我们的印刷术中告别了铅与火,汉字的输出有了质的飞跃,但这并没有让汉字的输入变得更容易。随着中国人的钱流入微软和英特尔的口袋,中国的汉字输入并没有赚到钱。除了五笔字型授权费,自然码注册费要收,养活四五个人,我也够聪明,搞点炒作,弄点新人气。谁能说我赚了多少钱?中文输入法,一个被所有中国电脑用户折磨了多年的“半老徐娘”,却没能引起大众的关注。看来他得抹点脂粉,乔装打扮或者隐姓埋名,或者嫁给别人!本来是名门望族,结果却落得个一年多的悲惨境地。在那些日子里,马奔腾挤满了人,在那个时候,有很多人。即便如此,还有人在暗暗努力:我不信这个邪。以我的美貌和背景,养不出漂亮的女儿。也有业主不愁吃穿,以为闲着也是闲着。我自己养一只猫狗,可以当女儿养,开心的时候带它出去散步。你在乎什么?今天没事,来看看哪些半老的徐娘和国色天香值得一探究竟。1.键盘输入大约65,438+00年前,一个朋友的汉卡提供了一种可以连续输入汉语拼音串的输入法,但是这哥们没卖出几件,就找不到踪迹了。这可能是第一个真正使用的“句子”输入法。后来1993左右的1.3版中文星提供了新的拼音输入法,至今仍被认为是最便捷的输入法之一。它可以实时显示单个单词,即在输入拼音的同时,可以同时显示汉字,错别字立即可见,没有的单词选择一次就能记住,还有一些关键位置的巧妙设计,如空格确认、重码逗号句号选择、模糊声音容错等。,已经成为今天所有拼音输入法的必备功能。这时候还有智能ABC。在1993开头的北大出版社,编辑告诉笔者,开发了一个非常好用的输入法,有类似新拼音的功能,也可以快速输入一些符号。输入V后,还可以通过笔画输入不认识的汉字。这是早期的智能ABC。后来和微软合作的很好,几乎所有的中文版Windows都是代工的,不过这个软件可能当时基本已经有了。事实上,无论是智能ABC还是新拼音,在技术上可能都源于上世纪80年代末张普、李惠琴等人主持的PJS项目,他们之间可能存在合作关系。1994年,有一件事对中国输入法的发展起到了重要作用。6月65438+10月65438+8月,龙光威和邦德两家公司合作成立了Autoway中文平台项目组。当时公司准备在DOS和WINDOWS环境下开发中文平台和文字处理软件,胃口很大,集中了一些强大的开发力量。由于资金问题,后来在6月1995调整了目标。专门开发了Autoway输入法,下半年推出了可以在Windows环境下持续输入汉字的系统。该软件由语言学界著名人士周有光题写,后来在电台和报纸上宣传,确实很成功。这种输入法最大的特点是用户只连续输入拼音,系统每隔几个拼音自动显示前面的汉字。达到一定长度后,汉字会自动进入应用软件的编辑器或由用户按回车键,无需手动分词。但由于准确率低、用户界面和易用性等原因,并未得到广泛普及。1996,输入法出了一匹“黑马”,恰好叫北京黑马公司。其“黑马输入法”只能在DOS下使用。现在作者还有当时买的正版,是几张软盘。如果在Windows下使用,输入法提供了DOS界面。用户输入一个句子的拼音串,按回车键,转换成汉字,存入文本文件,然后复制到其他应用软件。现在看来这个软件很难用,但是凭借这个厂商在中文校对方面的经验、资料和积累的资金,一步步发展起来,2001还在不断完善和升级。无论是“自交流”还是“黑马”,都说是汉字整句输入(也叫句子输入)的第一例,但其实除了笔者前面提到的功能,最早可以追溯到80年代末的哈工大。当时该校博士生王小龙研究中文分词,申请了863项目,写了一篇《最小分词问题及其求解》的论文。后来王小龙开发了InSun输入法,这是一个基于整句的输入系统。90年代初只是做了一些成果的演示和展览,据说偶尔卖给一些日本公司换一些特殊的打字机,但是很多年都没有动静。90年代中期以6.5438亿+的价格卖给了微软。当然这个价格挺好的。于是乎,从中文版的Windows 95开始,就有了大家看到的“微软拼音输入法”。虽然有很多批评者,但微软采取了类似的方式,并获得了智能ABC,并“免费”发送给中国的用户。但是,这种“自由”是形式上的。本质上,它的价格已经在Windows操作系统中计算好了,最终还是要算在用户身上。结果输入法开发者和厂商都吃了苦头。连微软提供的拼音输入法都不好用。有人曾调侃说,输入法就像感冒擦鼻子。按理说,鼻子有点小就要赶紧擦掉,不要等着掉到嘴里。但是微软拼音不是让你敲半天,再回去修改。由于智能程度低,错误令人费解。如果你敲手稿,你很幸运发现错误的。如果你想打字,你会发现错误的。无法与键入的拼音同步显示汉字(微软拼音落后一个字,Autopass落后几个字,黑马拼音需要最后确认才能出现汉字),以及高错误转换和修改拼音选择汉字的不便,都极大地制约了其使用。人们继续使用新的拼音或智能ABC,但它们有不支持GBK汉字和长期不升级新功能的缺陷。再加上句子输入法的不成熟,让中国输入法差点。这种沉默在1998被打破,这要感谢* * *享乐软件的出现。由于互联网的普及,网络的力量越来越大,新的个人力量开始涌现。出现了拼音星、通用码(通用吴彼)、智能吴彼等新的输入法。拼音星是谭亚军发明的。它是一个单字、词、短语和句子输入系统,包括全拼、双拼和谭码。也许是作者意识到了传统的单词输入法和句子输入法的优缺点,所以设计了一种完全“实时显示”的方法。无论输入多少拼音,每按一个字母,都会同时显示汉字,用户会立即发现拼音是否有错误。而且由于支持自动分词和整句输入,用户不用担心是输入一个单词还是一个句子,系统可以处理。没有单词,系统可以自动学习并保存,看起来既有单词输入法的便捷,又有整句输入法的智能。另外值得一提的是,利用双拼、偏旁部首或笔画的谭码还可以输入单词或整句,可以进一步加快打字速度,这恐怕是其他输入法所不具备的。该输入法只需一张软盘即可安装,程序小巧稳定,运行错误少,整句智能达到实用水平。因此,该软件于1997 ~ 1998上线,反响强烈,部分功能被未来的输入法模仿,如“实时显示”、输入类似拼音的各种符号、智能识别数字标点符号等等。中文明星网站也长期推广下载,捆绑销售金山公司的WPS2000。“飞鸟”在1999的最后评论说“拼音之星2000在功能上明显优于微软拼音输入法(2.0版),绝对是一颗耀眼的明星。”其中不乏好评,但肯定说明了将单词输入的便捷性与拼音整句输入的智能性结合起来是输入法的方向之一。拼音星采用插件技术,与中文星或Richwin等中文平台类似,所以在Windows下可以使用中西两种语言。这是个好主意,但也带来了很多问题。在中文Windows环境下,由于不是Windows自带的标准输入法IME格式,安装不正确可能会出现乱码。这个问题对拼音星等插件输入法也有负面影响,最新的拼音星2002 Build 1。因为之前版本的拼音之星没有提供同时两行显示拼音和汉字的操作方式,所以当拼音输入错误需要修改时,虽然可以按方括号【或】将汉字改回拼音,同时移动光标(不用左右方向键),但是手指移动范围比较小,这本来是一个很好的设计, 但是和传统的操作方式不同,所以用户并不知道,而且让人觉得修改拼音不方便。 所以千禧版2.0之后,拼音星在操作界面上完全复古。和中文之星新拼音一样,提供上下两行显示所有输入的拼音字母和自动转换的中文字符串。(注:这是一个旧的皇历。目前,拼音之星已经完全按照IME设计,与微软拼音和谷歌拼音的机制相同。用插件技术设计输入法当然有独特的优势,比如克服了标准IME(如智能ABC)的标点等缺点,无法在西文Windows中使用,无法在西文应用软件中跟随光标。输入法的另一个发展方向是功能的多样化。这方面的代表就是“万能密码”,也就是现在的“万能五笔”。通用码是一种结合拼音、吴彼、英语和笔画的文字输入法。它可以与多种功能一起使用,无需切换,如输入“苹果”一词,键入其拼音“苹果”,使用吴彼码,使用英文苹果。因此,对于习惯于传统输入法的用户来说,使用通用码是很容易的。

编辑这个五笔输入法

早期版本的通用码以拼音为主要设计方式,所以可以实时造词类似于新拼音,但拼音的功能并不强大,远不如拼音星和新拼音。因此建议《通用码》作者邓世强以五笔为主,主推“通用五笔”,兼顾多种输入法。该系统开发良好,曾获得“十佳* * *软件”称号。这种输入法最大的缺点是菜单选择太多,菜单界面设计杂乱,用户无所适从;中文Windows下的乱码和拼音单词短语的缺乏也是限制这种输入法进一步普及的因素。智能吴彼是另一种模式,它充分吸收了吴彼的精华并将其发扬光大。王马公司可能做梦也没想到,这么多人在为自己出谋划策。聪明的吴彼做了很多关于吴彼的文章,包括吴彼的编码提示,提示词库中是否有某个单词。很多以前输入过的汉字,用吴彼的一串短码就能快速输入,词库大(因为用吴彼编码,词库大,编码多),这也是很多用户喜欢的原因。但软件本身的质量设计也存在一些问题,界面不美观,菜单杂乱,操作键设计随意,充分体现了软件个人享受的局限性。到了1999,又出现了其他几种拼音输入法:拼音加、免费拼音输入法、考拉输入法。拼音加法其实是参与《中文之星》新拼音设计的廖恒毅的代表作。它结构紧凑,程序稳定,键位设计合理。此外,一些新增加的功能,如不切换输入西文,像智能ABC一样输入带笔画的未知汉字,快速输入各种简拼符号,使这种输入法受到文字输入者的欢迎,并在长城中文飓风中与拼音之星、智能吴彼、通用吴彼一起贴牌销售。但是拼音加法的缺点很明显。同义词库太小。如果连续输入两个或两个以上的单词,您必须不断选择单词并通过空格进行确认。免费拼音输入法最大的特点就是源代码公开(操作方式和功能没有太多新意),所以很多输入法爱好者都整理了自己的输入法供参考。考拉输入法刚推出的时候,是在清华的BBS上介绍的。操作方式几乎完全模仿了中文之星的新拼音,但克服了新拼音在部分系统中字体极小的缺陷,深受网友好评。从一开始,树袋熊的作者就在软件描述中声明他将出售它。后来真的卖给紫光公司了,2000年改进成紫光拼音输入法。这种输入法最大的特点就是完全忠于新拼音的操作方式,并且提供了较大的词汇量。在2.2、2.3等后续版本中,增加了智能组词,即用户连续输入9个单词以内的拼音串,无论有无这个单词,系统都能自动转换成汉字。系统按照词频和高频预见的方式给出词串组合,增强了操作的流畅性。另外值得一提的是,紫光拼音输入法善于吸收其他输入法的优点,如拼音星实时显示、符号智能识别、自定义字符串等。如果不切换添加拼音,直接用Enter键打西文,最终成为用户最喜欢的输入法。然而,紫光拼音输入法有一些明显的缺点。由于程序设计上的缺陷,不如拼音星和拼音加稳定。很多版本的输入法引擎经常出现错误,用户的词库太大,无法使用。在2.3版本中有所改进,但是切换应用时屏幕会闪烁。在Dreamweaver等一些西文软件中,输入栏会出现进进出出,在一些应用中出现乱码的问题,影响软件的正常使用。2000年,老字号新天地分拆成立了中华之星公司,主要推广一种叫做智能疯狂拼读的整句输入法。本质上类似于微软拼音、黑马拼音、拼音之星的句子输入,只是这家公司宣传的很好。智能疯狂拼I一推出就开始进行铺天盖地的广告宣传,号称首次推出整句输入法,并在2001发布了升级版智能疯狂拼II。智能疯拼对于输入法领域来说无异于一剂强心针。虽然中国之星还是没赚多少钱,但是中国开始关注中国IT曾经的软件霸主中国之星。而此时的2000年,中国正和全世界一样处于互联网狂潮中,而中国之星的前竞争对手四通李芳早已完成了初期融资,准备在美国纳斯达克上市,成为中国第一家中文门户网站。智能疯拼的界面不错。可以自定义多种颜色和字体,大小可以像Windows窗口一样随意拉伸。与微软拼音相比,拼音的修改和重码的选择都有所改进,拼音到汉字转换的正确性也不错。尤其是在学习了大量的中国古诗和名人谚语后,智能疯拼一时间号称最智能,但其自学习惯却不如拼音星和拼音Plus。自主学习习惯主要表现在两个方面:一个是独立输入一个拼音串,如果一开始不准确可以修改,然后下次输入同样的拼音或者简拼应该就能得到需要的结果,对于传统的文字输入法来说得心应手;另一方面,很难从正在输入的句子中学习到相应的单词,目前所有的系统都不尽如人意。智能疯拼的明显缺点就是太庞大。为了增加1% ~ 2%的转换精度,增加了几百兆的磁盘开销。一个输入法比操作系统还臃肿,这一招可能只有焦虑的人才想出来。还有一个软件,叫自然码,是老式的输入法,功能设计上有很多细微差别。声形编码与双拼和偏旁部首或笔画相结合,提供了一种快速输入汉字的方法。大词库是它的特点,在DOS时代曾经风靡一时,程序设计也很独特。刚进入Windows时代,开发缓慢,菜单设计没有考虑,比较乱。它和之前推出的通用五笔、智能五笔有着同样的问题,并且难以推出nt版本,让很多老用户忍痛割爱,投入新输入法的怀抱。2000年自然码也受整句输入的影响,推出了整句输入功能,转换速度慢,准确率低,修改困难,但是用起来太难了,不实用。到了2001的新版本,整句输入有了很大的提升,使用中文部首码不切换选择重码的方式别出心裁。如果进一步完善,操作的复杂性和模糊性就会降低,就会发扬光大。

编辑此段落中的语音输入和笔输入。

键盘输入多年后,在1998左右突然遭到猛烈攻击。其中无非就是说五笔太麻烦需要背字根,拼音太简单但是重码太多,打字慢。统计浪漫人物要看现状——发音和笔输入。包括IBM、微软、摩托罗拉、中字、紫光等公司在内的各大厂商都推出了自己的非特定人语音输入系统或手写汉字输入系统,一时间在市场营销和媒体推广上咄咄逼人,但笔者认为这两种输入法都还可以,但都不是正确的汉字输入方式。这两种方式这几年占了多少份额?源于语音识别技术的汉字语音输入,通常采用马尔可夫信息模型进行统计处理,采用基于规则的方法进行歧义判别。比如我们平时说话,说一个词的时候,别人可能因为代码重复而听不懂,但是我们说一个词,别人听懂的可能性就增加了。我们说一句话,别人就懂了。这是因为话语中的词与词是相互关联的。对这个相关因素进行定量的统计分析,得出常用词之间的统计定量关系。根据这种数量关系,计算机通常要识别录音语音,有时需要采用一定的语言规则和补充统计方法来提高机器的智能水平。让机器“听懂”人说的话,是一件很美好也很困难的事情。对它的研究可以推动很多技术的发展,它的成果可以应用到很多方面,比如乐器的语音控制,当然还有汉字输入。90年代中后期,IBM终于推出了非特定人连续语音识别系统ViaVoice,是目前语音识别领域的佼佼者。近年来,一批从事汉字语音识别的研究人员陆续加入外企。利用国外公司资金充足的优势,他们利用在国内研究所或大学学到的知识或研究成果,建立了庞大的汉语数据库(也称语料库),推出了汉语普通话语音输入系统,实现了每分钟150字以上的高速输入。中国也有类似的制度。为了证明语音输入系统的先进性和实用性,举办了多次键盘语音比赛。1998上半年10城市第一场比赛中,使用语音输入的选手最快输入速度高于使用键盘输入的选手,充分验证了“嘴比手快”的道理。一时间,语音输入大有可为。但是语音输入有一些目前难以克服的弱点。首先要求安静的输入环境,准确洪亮的发音。因为这个系统的上下文,一个错误会导致一连串的错误。如果你有口音,那结果就更不堪设想了。如果专业的入门文员采用这种方法,宽敞的机房就变成了一个小小的隔音空间,人连续几个小时大声朗读就会疲惫不堪。非专业人士使用电脑输入,主要是以“思考”的方式,即一边思考,一边直接在电脑上书写,而语音输入要求语音准确流畅,没有给思考留出足够的时间。其次,它需要学习用户的发音,让用户正常使用,无形中增加了使用的复杂性和不便性。因为语言环境差异很大,再大的语料也不可能穷尽。自动学习和获取新知识的能力有待加强,距离真正实用的系统还有很长的路要走。除了语音输入,另一个热点是笔输入。ViaVoice推出前一年,这款就已经开始火了,但并不代表市场有多火,只是厂商在做一个热闹的宣传。其实经过1997,基本实用的手写汉字输入系统已经达到了。采用了基于语义句法的模式识别方法,从笔画段-笔画-部首-整字四个层面一定程度上解决了联机手写汉字的识别率问题。其中,中咨公司的“汉王99”和摩托罗拉公司的“毕慧”表现突出。但是输入速度慢、使用不方便、眼睛长时间操作是手写输入不可逾越的障碍。因为书写板和屏幕是分开的,打字员写字时眼睛盯着书写板,字容易跑偏——在Windows环境下,“笔”很容易失去书写窗口的手柄,即使是全屏书写。一边写一边盯着屏幕,打字员眼睛特别累,无法输入大量汉字。所以手写输入只会在特定人群中流行。如果对电脑不熟悉,只需要输入少量的汉字。或者需要签名的人。同时,手持式PDA计算机也可以使用笔输入,因为机器体积小,而键盘输入不方便。当时厂商宣传“每台机器都有一支笔”,“笔”将成为和键盘鼠标一样的标准配置,被热炒了一段时间,就像去年的“网络经济”一样,出现了浓浓的泡沫。这几年来,在电脑中几乎看不到笔输入,尤其是在应用最广泛的PC中,但在“Business Connect”等功能单一、体积较小的掌上电脑中却开始流行。看汉字输入,拼音输入还难以达到巅峰,五笔输入在背根竞争中领先还能得到一些收益;对着麦克风输入语音的侃侃和在一块木板上“涂鸦画鸟”的“神笔仙指”,似乎鲜有新的成果。中国人能爬上进口的门槛吗?= = = = = = = = = = = = = =除了上面文章提到的输入法,从2006年开始,新的输入法陆续诞生,包括谷歌拼音输入法、搜狗拼音输入法(搜狗拼音)、QQ拼音输入法,加上之前的微软拼音、紫光(现为紫光华宇)拼音、拼音plus。以及各种五笔输入法、形码、音码,构成了互联网时代的中文(汉字)输入法时代,为我们的生活增添了更多的便利。感谢这些输入法的发明者和开发者。