汉字的起源和发展过程

汉字,一种记录汉语的书写系统,在日语、朝鲜语和越南语中仍然或曾经使用。汉字是世界上最古老的文字之一,已有4500多年的历史。狭义上是汉族的文字;从广义上讲,是汉字文化圈的同字。

汉字是中国文字最基本的单位,最晚从商代就开始使用,并经历了甲骨文、大篆、小篆、隶书、楷书(草书、行书)等多种写法的变化。秦始皇统一中国,李斯整理小篆,于是“同文不名”的历史开始了。虽然汉语方言发音差异很大,但文字体系的统一减少了方言差异带来的交流障碍。

东汉许慎在《说文解字》中把汉字的结构规律概括为“六书”:象形字、表意字、会意字、形声字、音译字、借字。其中,象形字、指法、会意字、形声字是造字的原则,这就是“造字法”;调注和借是用词的规则,是“用词的方法”。

3000多年来,汉字的书写方式没有太大变化,使得后人能够无障碍地阅读古文。然而,近代西方文明进入东亚后,整个汉字文化圈的各国掀起了一股向西方学习的潮流,其中放弃使用汉字是这场运动的一个重要方面。这些运动的论点是,汉字与西方拼音文字相比,显得笨重笨拙。许多使用汉字的国家都不同程度地简化了汉字,甚至试图完全拼音化。日语假名的拉丁音译方案,以及汉语中各种拼音方案的出现,都是基于这种思想。中国大陆参照草书简化了汉字的笔画,并于1956年6月28日修订批准了《简化字总表》,在中新两国沿用至今。台湾省一直使用繁体中文。

目前使用汉语的地区,大多使用两种规范汉字,即繁体字(繁体字)和简体字(简体字)。

汉字是承载文化的重要工具,目前有大量用汉字书写的古籍。不同的方言都使用汉字作为* * * *的书写体系,所以汉字在历史上对中华文明的传播起到了重要作用,成为东南亚文化圈形成的内在纽带。在汉字的发展过程中,留下了大量的诗词、楹联等文化,形成了独特的中国书法艺术。

一个汉字一般有很多意思,也有很强的构词能力,很多汉字可以独立构词。这就导致了汉字极高的“使用效率”,2000个左右的常用词可以覆盖98%以上的书面表达。再加上表意文字的特点,汉字的阅读效率很高。汉字的信息密度比字母高,所以平均来说,同样内容的中文表达比其他任何字母语言都要短。

目前,汉字系统分为繁体字和简体字。前者用于台湾省、香港、澳门和北美的华人社区,后者用于中国大陆、新加坡和东南亚的华人社区。总的来说,虽然两种汉字书写体系存在差异,但常用汉字的个体差异在25%以内。

由于汉字书写的复杂性,“汉字落后论”由来已久,认为汉字是教育和信息化的瓶颈,有推动汉字“拉丁化”甚至废除汉字的趋势。现在普遍认为汉字也有突出的优点。虽然刚开始学起来比较难,但是掌握了常用词之后就不存在类似于大量英语单词的持续学习问题,而且其表意特征可以充分调动人脑的学习能力。在电脑输入问题基本解决后,“汉字落后论”和“汉字拉丁化”实际上已经被大多数人逐渐抛弃。

目前,汉字体系已经基本稳定,但汉字的规范化和生僻字的自然消亡仍在继续。

造词原则

刘舒是汉字组合的基本原则,这一点在《李周》中有所提及,但没有说明具体内容。东汉许慎在《说文解字》中阐述了汉字“刘舒”的结构原则:象形、表意、会意、形声、表音、音译、借用。

象形字:这种造字方法是根据一个物体的外观特征来描述的,所以把它画为它的物体也是真的。如日、月、山、水,最早是描绘日、月、山、水的图案,后逐渐演变成现在的形状。

指物:这是指抽象事物的表达方法,所谓“各指其物”也是如此。如果你在上面写“上”,人们会在上面写“下”。

形音:这是一种在文本中由特定的形(根)所表达的独特的声音。比如:胡,字也可以是根,结合不同的属性根,可以合成为:蝶、蝶、湖、葫芦、胡、气等。,并用相同的发音表达不同的事物(有的只有声母)。但由于古今语言的音韵变化,很多相似的古形声字在今天的普通话中没有同音字。

理解:这种造字方法是将两个部首组合起来,衍生出新的意思。比如太阳和月亮合二为一,阳光和月光就变“亮”了。“人”字和“话”字合在一起就是“信”字,意思是以前人们说的话;有一个信,就是这个人遵守他说的话。

[url]注意:这是用于两个互相说明,同义但形状不同的词。汉代的许慎解释说:“建一类,同意接受,试验一下,永远是。”,这怎么说呢?古代的“考”字可以说是“长寿”,“老”和“考”的意思一样,就是所谓老人考,考生老。《诗经》雅?白朴还说,“周王寿考。" .苏轼的《屈原塔》诗里也有一些不死的古人,为什么要比较呢?一句话。其中“考”意为“老”,特别值得注意的是,后世文献学家对许慎的前述定义也做了大量解释。其中,有三种类型,即形移论、音移论和义移论。但也有人认为这三种说法不够全面。当代古文字学家林允先生也解释说,“专诸”是记录两个读音和意义完全不同的词的一种形式(词根)。如甲骨文中的“扫帚与女人”、“母女”。

借用:简而言之,借用这个词是用来表达别的东西的。一般来说,有一个新生事物是无法描述的,所以我们借用一个发音相近或者属性相近的词根来表达这个新生事物。比如“有”本来是右手的意思(最早见于甲骨文),后来被假借为“你”。闻,就是用耳朵听东西的意思。比如“大学?第七章有一句“视而不见,听而不闻,吃而不知其味”,但后来被用作嗅觉动词(虽然有人认为是误用)。

总结以上六书,前两项,“造字法”也;二项,“结合法”也;最后两项,“用汉字”也是。这六项原则是古代文字学学者总结出来的文字学理论。其中包含的汉字造字规则是经过长期演变而来的,不是任何一个人独创的。

汉字结构

汉字是由一个或多个偏旁部首(欧洲语言是一维字符)在特定的空间里排列成一个正方形而成,所以又有方块字的别称。从结构上看,汉字有以下特点:

在一个单词中有很高的信息密度。当你表达同样的东西时,可以用比表音法更短的篇幅表达同样的信息,所以汉字的阅读效率很高。

一个汉字由金、木、水、火、土等400多个象形字母组成,像搭积木一样组合在一起。

一个未知字符的意义是可以分离的,它的意义可以从字根的构成和空间的构型中推断出来。当新事物在时代演变中难以表达时,也可以根据部首组合原则合成使用新词。例如,中文单词铀是现代创造的一个新词,用来表达一种新发现的化学元素。

汉字字根的空间构型对词义有影响:如果是同一个“心死”组合,左右一排“忙”,上下一排“忘”,排列不同,产生不同的意义;文字右边有“艾”字的部分,表示右手(左手的意思是左手)握着什么东西,向左根做什么事情(考古发现的金文、甲骨文)。如果右手在上面拿着什么东西,就变成了“Ai”,几乎所有有这个根的人都是攻击性的,或者使用暴力来达到某种目的,比如攻击、击败、敲打、收集等等。

字体(中国书法)

“国”字的笔画汉字有不同的写法,即有不同的字体;不同的字体有不同的字形。

用正规字体书写的汉字(如楷书、宋体、隶书、篆书等。)都是一种方形字符,每个字符都占据相同的空间。汉字包括字母组合字和组合字,字母组合字是不能分的,比如“文”、“中”。组合汉字由基本部件组成,占汉字的90%以上。常见的合成词组合有:上下结构,如“微笑”、“尖”;左右结构,如“字”、“族”;半封闭结构,如“相似”、“倾向”;全封闭结构,如“团”、“会”;复合结构,如“赢”和“点”。汉字的基本部件包括单字、偏旁和其他非构词部件。

汉字的最小构成单位是笔画。

写汉字的时候,笔画的方向和出现的顺序,也就是笔画的顺序,是相对固定的。基本规则是:先横后竖,先左后下,从上到下,从左到右,先外后内,先外后内,然后封口,先中间再两边。不同书写风格的汉字笔顺可能不同。

发音

汉字是很多方言的同一个书写体系,每个字代表一个音节。现在,普通话被用作中国大陆的标准发音。普通话的音节由一个声母、一个韵母和声调决定,实际使用的音节超过65,438+0,300个。因为汉字数量庞大,有明显的同音字;同时也存在同一个字有多个声调的情况,称为多音字。这种情况在各种各样的中国人中普遍存在。

汉字虽然以表意为主,但也不是没有表音成分。最常见的是人名和地名,其次是外来词的音译,比如沙发。此外,还有一些原音词,如(易茗)“唉”和“哈哈”大笑。但即便如此,还是有一些表意元素,尤其是国家的名称和地名。即使是外国的名字、地名,也有一些表意的底线,比如“布什”一定不能音译为“神仙”。

因为汉字本身是不表音的,虽然从汉代到20世纪汉字的数量和书写方法都有变化,但是我们看不到语音的变化。需要进行专门的研究来推断它们在古汉语和中古汉语中的读音。有学者认为,在汉代以前,一个汉字的发音是两个音节,一个小音节和一个大音节,类似于今天的朝鲜语和日语。详见古代汉语。

汉字在日语中的读音可分为“音读”和“训读”,一个字往往有多个读音,这是因为不同时期从中国传入日本的读音不同。

韩语的话,大致就是一个字一个音,没有训练。

除了日本,其他使用汉字的国家也使用一些复音字,如“里”(海)、“浩”(加仑)、“浩”(千瓦)。但由于官方废除,在中国大陆基本不使用,但在台湾省仍在使用,大多数人理解其含义。

转录

最早的注音方法是读if法和直接注法。读若法是用读音相近的字做注音,这是许慎解释汉字时所用的,如“射、射、读若准”。直接注法是用另一个汉字来表示这个汉字的读音。比如《一个女人为自己说话》,说话的人说“悦”是用来注音的。

以上两种方法都存在固有的缺陷。有些字没有同音字或者同音字太生僻,很难起到注音的作用,比如“袜子”。

反切法是魏晋时期发展起来的,据说是受梵文的影响,梵文用的是拼音文字。汉字的读音可以用反切法标注,即把第一个字的声母和第二个字的韵母、声调组合起来做注音,这样就可以把所有的汉字读音组合起来。比如“连”的发音就是“郎”的声母和“点”的韵母、声调的组合。

近代以来,发展了汉语音标(俗称ㄅㄆㄇㄈ)和许多拉丁字母的注音方法。音标仍然是台湾省教学的一部分,但目前,汉语拼音在中国大陆使用最广泛。

因为汉字主要是表意,所以注音弱。这个特点使得最近一千年的文献,和使用拼音的西方世界一样,在措词上没有太大的差距,但也使人们很难推断出古代的音韵。例如,“庞”的发音来自“龙”,但今天前者在北京话中读作“庞”,后者读作“龙”。如何解释这种差异是音韵学的课题。

汉字和单词

汉字是汉语构成的最小单位。

语素是汉语表意文字的最小单位,类似于英语单词和短语。绝大多数汉字都可以独立构成语素,比如“I”,类似于英文单词由单个字母组成,比如“I”。现代白话文的大部分单词都是由两个以上的汉字组成的。但与英语中“单词”和“字母”的关系不同,语素的意义往往与每个汉字独立构成语素时的意义相关,从而在相当程度上简化了记忆。

词包括语素和由几个语素构成的短语。

汉字的高效率体现在几百个基本的象形文字,可以合成成上万个汉字,代表天上地下的各种事物;几千个常用词,很容易组合成几十万个词。

然而,另一方面,准确把握这几十万个词语的搭配形式和用法也成了一种负担。汉语常用词约数万个,总词汇量约百万。虽然从数量上来说似乎令人望而生畏,但由于大多数汉语构词法的表意性,基本掌握它们并非遥不可及。所以就词汇而言,其学习难度并不高;相比之下,掌握同样数量的外来词的记忆强度要大得多。

从古代汉语的角度来看,汉字的本义比五四白话文运动更准确高效,比如朱邦复先生就推动了汉字在古代的准确使用。

汉字的数量:汉字没有确切的数量,日常生活中使用的汉字数量大概是几千个。据统计,1000常用词可以覆盖92%左右的文字材料,2000字可以覆盖98%以上,3000字已经达到99%。简化的统计和传统的统计差别不大。

历史上有8万多个汉字(也有6万多个说法),大部分是异体字和生僻字。绝大多数异体字和生僻字已经自然消亡或被规范化,一般只是偶尔出现在除古汉语以外的人名和地名中。另外,在第一批简化字之后,还有一批“二简化字”,已经废止,但仍有少数数字在社会上流行。

汉代许慎在《说文解字》中第一次统计了汉字的数量,* * *收录了9353个字。后来南朝顾写的玉片记载为16917字,在此基础上修订的《大广益会》玉片据说有22726字。之后,宋代官方编辑的《类篇》收了31319字。另一部由宋代官方编著的《纪昀》收字53525字,曾是收字最多的一部书。

另外,有些字典的字数更多,比如清代的《康熙字典》,有47035个字。日本《大汉和词典》有48902个字,附录有1062个。台湾省的《汉语大词典》有49905个词;《汉语词典》有54678个单词。20世纪,汉字的海洋是发表字数最多的,有85000字。

在汉字计算机编码标准中,目前最大的汉字编码是台湾省的国家标准CNS11643。目前,(4.0)***包含76067个可验证的简体、日文、韩文汉字,但并不普及,仅在户政系统等少数环境中使用。台湾和香港常用的大五码包括13053个繁体字。GB18030是中华人民共和国最新的内码字符集。GBK包含20912个简化字、繁体字、日文和韩文,而更早的GB2312包含6763个简化字。Unicode统一表意基本字符集包含20,902个汉字,有两个扩展区,共70,000多个字符。

早期的汉字系统,字数不足,很多东西都是用通假字来表示,这就造成了文字表达的模糊性。为了提高表达的清晰度,汉字经历了一个逐渐复杂、字数大量增加的阶段。汉字数量的过度增加造成了汉字学习的困难,而单个汉字所能表达的意义是有限的,所以很多单个汉字的意义都是通过汉字词来表达的,比如常见的双拼词。目前,中国文字的发展趋向于创造新词而不是新词。

汉字编码系统:为了交换信息,使用汉字的各个地区都制定了一系列的汉字字符集标准。

中国大陆采用国家标准代码(“GB”是中华人民共和国国家标准的简称)。GB2312包含6763个汉字,GBK包含20912个汉字,最新的GB18030包含27533个汉字。

BIG5。包括13053个汉字。台湾省和香港使用的单字节或双字节代码。

中国政府不太接受统一码。中国政府要求在中国大陆销售的软件必须支持GB18030编码。

在国际交流和软件设计领域,CJK编码收集中文、日文和韩文汉字。

关于Unicode:由于各国国家标准字符集的汉字和常用字数量的差异,虽然中国两边的GB/BIG5字符集的常用字基本相似,转换后读取不是问题,但是编码转换的混乱关系一直是文字交流的障碍。因此,在相关国家标准化组织和编写人员的共同努力下,包含中日韩(CJK)汉字的Unicode汉字标准ISO10646.1+0终于在1993年完成。Unicode是双字节表示的多国字符编码系统,编码空间为0x0000-0xFFFF。翉O10646.1汉字标准使用代码0x4E00-9FA5,* *包含20902个汉字。其中有Mainland China (S)提出的17124汉字,台湾省(T)提出的17258汉字;S和T的并集,即中国(C)提出的汉字数为20158。日语(J)提出了12157汉字,中国没有提出690(Ja);韩国(K)提出的汉字有7477个,其中90个不是中国(Ka)提出的;卫东和Ka联盟集***744字。支持Unicode编码的相关计算机系统软件,如UNIX和WIN 95,已经推出。但由于Unicode的ASCII码采用双字节编码(即一般计算机系统中的单字节ASCII码前面加0x00),其汉字编码与各国现有编码不兼容,不能直接使用现有的软件和数据,所以目前完全使用Unicode软件系统的用户并不多,大部分只是将其作为一种国际语言编码标准。

另请参见:

/view/1712.html