试论信息处理与现代汉语轻声(2)
时间:
若木1由 分享
三、普通话常见的轻声词语
普通话中常见的轻声词语一般有一定的规律,主要有以下几种:
1.助词“的、地、得、着、了、过”和语气词“吧、嘛、呢、啊”等。 例如:
我的、迅速地、热得很、拿着、看了、去过、好吧、好嘛、你呢、是啊。
2.部分单纯词中的叠音词和合成词中的重叠式的后一个音节。例如:
猩猩、饽饽、妈妈、星星、坐坐、劝劝、催催、讲讲。
3.构词后缀“子、头”和表示群体的“们”等。例如:
桌子、辫子、木头、石头、我们、他们。
4.名词、代词后面表示方位的语素或词。例如:
桌子上、脸上、山下、前面、前边、教室里、箱子里。
5.动词、形容词后面表示趋向的词“来、去、起来、下去”等。例如:
起来、过去、出去、上去、热起来、拿出来、跑过去、走回去。
6.下面词语里加着重号的字一律读轻声。例如:
来来去去、打打闹闹、黑不溜秋、胡里糊涂、傻不楞登。
7.有一批常用的双音节词,第二个音节习惯上要读轻声。例如:
巴结、巴掌、包袱、本事、编辑、扁担、别扭、玻璃、薄荷、簸箕、不是、裁缝。
苍蝇、柴火、称呼、出息、畜生、刺激、聪明、凑合、耷拉、大方、大爷、大意。
大夫、耽搁、灯笼、嘀咕、地道、地方、地下、东西、动弹、豆腐、对头、多少。
哆嗦、耳朵、翻腾、分析、风筝、高粱、胳膊、疙瘩、工夫、功夫、姑娘、故事。
棺材、官司、规矩、闺女、哈欠、含糊、核桃、合同、狐狸、葫芦、胡同、糊涂。
四、信息处理与轻声
由于轻声能区别词性和词义,再加上汉字是表意性的文字,不直接表音,所以,轻声现象通过表意性的汉字表现不出来,这给人们朗读带来了很大的麻烦。特别是习惯轻声,由于人们把握不准的话,不知道该不该读轻声,有的读不读轻声,意思不一样,例如:
1.他这种助人为乐的精神值得我们学习。
2.老张年龄那么大了,但显得很有精神。
3.这篇文章的大意我明白。
4.你太大意了,以后可要小心哪!
这两组句子,分别都有两个“精神”和“大意”,但在每一个句子中只有一种读法,前一个读原调,后一个读轻声。联系“精神”和“大意”前后的词语,就可以理解句子意思。
但是,像下面的句子:
5.到一个新的地方分不清东西。
6.这是你的不是?
7.他们一直打冷战。
8.那两个是小王的兄弟。
9.他实在不会说那种话。
10.那个人很像大爷。
这些句子例5中的“东西”里的“西”读阴平,“东西”表示方位,指东边和西边。当“西”读轻声时,“东西”指的是物品。例6中的“不是”里的“是”读去声时,“是”为动词,“不是”表示否定。当“是”读轻声时,“不是”表示错处、过失。例7中的“冷战”中的“战”读去声时,“冷战”指他们双方之间进行的无声较量。当“战”读轻声时,表示因寒冷或害怕浑身突然发抖。例8中的“兄弟”里的“弟”读去声时,“兄弟”指的是哥哥和弟弟,当“弟”读轻声时,指的是弟弟。例9中的“实在”里的“在”读去声时,“实在”是形容词,表示很老实、本分,当“在”读轻声时,“实在”是副词,表示的确的意思。例10中的“大爷”,当“爷”读阳平时,“大爷”指的是不好好劳动、傲慢任性的男子,当“爷”读轻声时,表示是伯父或尊称年长的男子。
这些词语在句子里会有两种读法,两种理解,而且单独就一个句子而言,两种读法、两种理解都成立。我们人工阅读或说话时,要准确地理解其中的意思,只有联系上下文去理解。那么,这种现象在计算机信息处理时,就遇到了困难。在一个句子里,读原调和轻声,所表示的意思都成立,这是由于轻声的缘故构成的歧义句。这种现象给人工阅读带来了麻烦,需要再联系上下文去理解意思,当然,计算机要理解这些句子的意思就更困难了。也正如亢世勇说的“尽管信息处理专家运用了规则排歧、统计概率排歧或者两者结合起来等多种方法进行排歧,但到目前为止,还没有一种方法、一种系统能够彻底解决这个问题。”
因为,目前,计算机完成了“字处理”,在“词处理”和“句处理”的过程中,遇到的问题比较多。例如:词的切分问题,词性的标记问题,也就是说让计算机面对真实文本自动进行词的切分和词性标记。其中词的切分这一项,是字处理突破后中文信息处理所必须突破的又一个核心问题,是必须要闯过的第二道难关。从20世纪80年代以来,计算机学界和汉语言学界联手攻克词的切分这一难关,20多年来,都取得了可喜的成果,研制了一些相应的软件。到目前为止,计算机自动分词,正确率可达到90%到95%,剩下的5——10%的词的切分问题,难度也比较大。其中就包括歧义句的词的切分问题,当然也包括由于轻声引起的歧义现象。对于歧义句的理解,我们运用增加、替换词语,或联系上下文理解意思。这又涉及到“句处理”的问题。句处理的主要内容是,怎样使计算机理解自然语言(现代汉语)的句子的意思,又怎样使计算机生成符合自然语言规则的句子。由此可见,“句处理”所需要的语言知识,将是一种涉及到语音、语义、语法、语用等多方面的综合性知识。而且,“句处理”要解决的核心问题是排除歧义的问题。科学家们正在努力攻克这一难关,争取早日突破信息处理中的一大瓶颈问题。
参考文献:
[1]徐世荣:《试论北京语音的“声调音位”》,《中国语文》,1957.7。
罗常培、王 均:《普通语音学纲要》,商务印书馆,2002。
厉为民:《试论轻声和重音》,《中国语文》,1981.1。
林 焘、王理嘉:《语音学教程》,北京大学出版社,1992。
林茂灿、颜景助:《普通话轻声与轻重音》,《语言教学与研究》,1990.3。
亢世勇:《面向信息处理的现代汉语语法研究》,上海辞书出版社,2004。