语言学研究中如何保证语料库的覆盖面
1.语料库语言学的语料库和概念语料库,也称为语料库或材料,是储存语言材料的仓库。语料库是收集和科学组织的语言材料的数据库。这种材料自然出现在某种语言中,可以是书面语,也可以是口语。这些未经加工的材料是语言统计的基础,是分析和研究语言规律的第一手材料[2 ~ 3]。语料库语言学是在文本语料库的基础上研究语言的学科。不同的研究者对语料库语言学持有不同的观点。
点。有人认为语料库语言学是一个理论框架,是一门与语言学其他分支并驾齐驱的新学科。另一些研究者认为语料库语言学不是一门独立的学科,但它为语言研究提供了方法论基础,同时也为语言学研究提供了一种新的哲学思维。为了解决这一问题,中国研究者在总结国外著名语言学家韩礼德、利奇、托格尼尼-博内利研究成果的基础上,指出只有语料库可用。
语料库语言学是当语言学家利用其中的语言材料和事实来批评现有的语言学理论并提出新的观点或理论时,对一门新学科的称呼[3 ~ 6]。总的来说,语料库是利用真实的语言材料研究语言某一方面的方法和手段。借助语料库语言学提供的方法,语言学家不仅可以验证现有的语言规则,还可以根据语料库提供的数据描述不断演变的语法和语用规则。过去,语料库中的材料是人工收集和整理的,通常用于计算词汇的使用频率,作为编写教材和词典的依据。现在,利用计算机建立语料库的效率和规模都有了很大的提高。语料库是从有代表性的语言材料中随机选取的。
—
09
—
样本输入到计算机中,可以由计算机处理的大量文本组成。语料库接收的文本越多,覆盖的范围就越广,提供的信息就越可靠。语料库的构建包括收集原始材料形成原始语料库,然后对语料库进行标注生成标注语料库。我们可以利用语料库分析软件对标注的语料库进行各种统计分析,从而揭示目标语言的各种特征。
二,语料库语言学在语言研究中的作用
语料库语言学的发展对语言研究的深入起到了积极的推动作用。一方面,它影响了语言学习观念和语言学习方法;另一方面,它为一些语言学习理念的实施提供了基础。本文只讨论语料库对语言研究的三个方面的影响。
(1)语言是描述性的还是规定性的?
无论语言是描述性的还是规定性的,不同的时期有不同的侧重点。在18世纪,主要的欧洲语言是通过规定的方法学习的。语言学家总是试图制定各种正确使用语言的规则,这些规则强调语言的正确性和拉丁标准模式的应用。因此,语法是语言研究和语言学习的重点,有些用法在被规定后需要反复记忆,“因为这是一个非黑即白、对错的问题”[7]。在这种观点的影响下,语言教学采用以教师为中心的语法翻译法。语言教学的方法包括大量定义和规则的解释和记忆。书面语经常受到更多的关注。相应的观点是,语言是一门描述性的科学。在这种观点的指导下,语言学家在不使用其他规则来纠正社区语言的情况下,尽力发现和记录某一语言社区实际使用的语言。语料库语言学为这一观点提供了基础和可行性。通过对语料库中大量实例的研究和分析,可以总结出语言的实际应用规律。这种观点在语言学习中的体现就是更加关注学习者的个人需求,变以教师为中心的填鸭式教学为以学生为中心的知识探索式教学。在教学活动中,教师不再一味地灌输语言规则和语言知识,而是要求学习者通过搜索语料库接触真实自然的语言,观察语言现象,分析总结语言规律,做出假设,并在语言运用中不断检验和修正自己的假设。教师也从传统的知识传授者转变为与学生平等的知识探索者和语言研究者。诚然,片面强调语言是规定性的还是描述性的,似乎不够客观。从语言的规定性出发,语言研究者和学习者可以简化复杂的语言,宏观地把握语言的基本框架,降低语言研究和学习的难度。对于语言学习者来说,学习动机和兴趣可能不会太高,学习方法也比较死板。从语言的描述性来看,语言研究者和学习者会接触到丰富真实的语言,通过观察、分析、总结语言规律来达到学习和掌握语言的目的。在这个过程中,研究者和学习者都是主动的,所以他们的动机和兴趣会大大提高。
(2)语言和言语,以及语言能力和语言运用。
索绪尔把语言分为语言和言语。语言是社会系统全体成员共同使用的语法系统,是一群人大脑中的潜能。它是社会性的、同质的、抽象的语言形式。而言语是社会中每个个体所产生的语言,是异质的、多种多样的[5]。由于对语言本质和语言与言语划分的不同理解,出现了结构主义和功能主义两大流派,他们对语言的研究重点也不尽相同。结构主义研究的语言是凌驾于个人和社会之上的抽象符号系统。功能主义强调语言的使用功能,考察实际的语言现象,试图找出* * * *的结构。在索绪尔研究的基础上,乔姆斯基提出了两个概念:语言能力和语言应用。乔姆斯基认为,语言使用者对语言的规则有一种本能的把握,语言能力是根植于大脑中的个体能够按照有限的规则生成无限的词语的语言知识。语言学家关注能产生无限言语的有限规则。语言使用的概念与索绪尔定义的言语概念非常相似,是指语言在特定场景中的真实使用。语料库语言学为功能主义的进一步发展提供了更加科学的研究方法,其研究重点是言语和语言使用。通过对言语和语言使用的深入研究,我们可以验证现有的规定性语言规则,并试图概括出新的语言规则。语料库对言语和语言使用的研究体现在语言研究的各个方面,如语域的研究;分析本族语者的话语,总结其典型结构,用于编写口语教材;统计高频词,应用于教学大纲的设计;分析比较外语学习者的语言使用情况,探索更有效的学习策略。对语言和语言能力的研究是在语言习得中进行的,即以潜意识形式存在于人的大脑中的规则是何时、如何形成的。因此,语料库研究的是具体的语言,而对语言和语言能力的研究更侧重于抽象的语言。我们不能盲目地肯定或否定某种研究方法,因为语言可以从多个角度进行研究,不同的研究角度可以相互补充,服务于不同的目的,满足不同的需求。然而,语料库的出现为语言研究提供了条件。
—
1
九
—
新视角让语言研究更加客观真实。
(3)组合关系和聚合关系
索绪尔是结构主义学派的创始人。他认为语言是一个符号系统,所以语言学家必须尽力从一个符号与其他符号的关系中找到语言的价值,了解符号在系统中的位置。索绪尔提出了两种主要的语言关系:组合关系和聚合关系。组合关系是指同一序列中一个单元与其他单元之间的关系,或者该领域中所有成分之间的关系。聚合关系又称关联关系,是指在结构的特殊位置上可以相互替换的构件之间的关系,或者是在现场的构件与不在现场的构件之间的关系。聚合关系中的词具有相同的句法特征,但不能语义替换[7]。大规模语料库的出现为两者关系的研究,尤其是组合关系的研究提供了巨大的空间。因为计算机有能力搜索一个特定的词,研究所有和这个词有* * *关系的词。这也是平时研究的搭配关系。韩礼德(1976)将搭配定义为“反映显著邻域内词汇项组合关系的线性* * *现象”。这个定义明确地把搭配定义为组合关系。在搭配研究中,琼斯和辛克莱(Jones & amp;Sinclair)是第一个在语料库中研究词语搭配的研究者。自20世纪80年代以来,基于语料库或语料库驱动的词语搭配研究广泛开展,极大地改变了搭配研究。提高了研究效度,增加了定量研究的比重,搭配能力具有可观察性和可操作性。自动化程度越来越高,研究过程中的人为干扰因素大大减少。丹尼尔·克里格(Daniel Krieger)在他的论文[9]中通过对“any”用法的研究,肯定了语料库语言学在组合关系研究中的客观性。按照传统的语法规则,否定句和疑问句中通常使用“any”,但Mindt的统计显示,肯定句中“any”的频率为50%,否定句中为40%,疑问句中仅占65,438+00%。因此,语料库为组合关系的研究提供了极大的便利。聚合关系的研究更多体现在一些同义词的研究上。例如,崔在她的文章中指出,Rundell利用语料库[10]对同义词“start”和“begin”这一组进行了比较研究。这些研究成果为利用语料库研究组合关系和聚合关系提供了模式,语言研究者可以利用语料库做很多类似的研究。
三,当前语料库研究中存在的问题
毫无疑问,语料库在语言学研究中发挥着积极的作用,但目前最大的问题是只有少数语言研究专家掌握了语料库研究方法,大多数语言教师和语言学习者不了解语料库,不知道如何利用语料库资源进行科学研究。然而,关于语料库使用的文章却很少。因此,培训语言教师和语言学习者大规模使用语料库资源,将更有效地发挥语料库的作用,极大地推动语言研究和语言学习的步伐。
语料库为语言研究提供了新的思路和方法,但语料库资源的利用率有待大大提高。只有更多的语言教师和语言学习者与语言大师语料库有最密切的联系,语料库才能真正促进语言研究和语言学习。