从全唐诗对偶字中提取字义网络图

    语言统计分析期末大作业要求我们统计全唐诗中的对偶字,并用所得到的统计结果反过来评判出对仗最工整的诗句。我在数据处理过程中突然想到,鉴于互成对偶的两个字之间有一定的语义联系,我们便有了一个庞大的汉字语义关联库;如果把所有汉字之间的关联画成一张图会是什么样子呢?于是我用 Mathematica 7 提出了全唐诗中处在对偶位置上的所有字对,得到了 464448 个可能的对偶关系;再利用一些算法得到了最稳定、最常用的 2000 个对偶关系,把它们都描绘在一张大图上,于是便有了上面的这个图。点击这里查看高清无码大图,1600×1600 像素。可以看到,有语义关联的汉字自动地聚合到了一起。

Read more…

为什么把敌人打败了=打敌人,但把肚子笑疼了≠笑肚子?

    转眼间又到期末了,各科的课程都差不多结束了。回顾这个学期的课程,音韵学毫无疑问成为了最不科学的课,而语义学和虚词研究则成为了本学期最具科学性的两门课。这学期我在沈阳老师的语义学课程中学到了不少东西,有几节课尤其精彩,以至于当时我就拍案叫绝,发誓一定要把它们写到Blog上。最精彩的一节课是关于“把”字句分析的专题讲解,其科学性、趣味性和大众性远远超过了这里这里的例子,成为了我向别人介绍语言学时引入的最佳例子。从对“把”字句的分析中我们可以看到更多语言学研究方法,其论证思想绝不亚于数理学科。

    小学语文变“把”字句“被”字句时无外乎“风把小树刮倒了”、“解放军把敌人打败了”、“大水把铁牛冲走了”,这无形之中给人带来了这样一种错觉:“把”字后面的名词是动词的宾语。例如,“小树”就是“刮”的宾语,“敌人”就是“打”的对象,“水”冲走的当然也就是“铁牛”。事实上,确实也有很多学术文章指出,“把”后名词就是动词的宾语。“宾语说”的支持者们提出了一个直观的、强有力的证据:你可以把“把”字句重新还原回主动宾结构。例如,“风把小树刮倒了”的意思就是“风刮倒了小树”,“解放军把敌人打败了”就相当于“解放军打败了敌人”,“大水把铁牛冲走了”无异于“大水冲走了铁牛”。这种说法虽然适用于绝大多数“把”字句,但也并非毫无破绽。例如,“妈妈把钱存在银行里”怎么还原为主动宾结构?妈妈存钱在银行里?妈妈存在银行里钱?都不对。这一反例足以对“宾语说”构成威胁。事实上,我们能举出很多例子来驳斥“宾语说”。一种听来奇怪但我们日常生活里常常使用的句子就是“别把自己病倒了”,这里“自己”明显只能是“病”的主语。类似的句子不止一个,像“他把老伴儿死了”、“把犯人跑了”等等,感觉虽然奇怪,但实际生活中用得不少。另一类句子更奇怪,动词和“把”后名词间根本没有直接联系,像“把肚子笑疼了”,“肚子”一词既不是“笑”的主语,也不是“笑”的宾语,事实上它与“笑”没有任何关系。“把眼睛哭肿了”、“把手帕哭湿了”也是如此,“眼睛”和“手帕”与动作“哭”没有任何结构上的联系。“宾语说”至此已完全破产。

Read more…

数学无处不在:语言、文字与数学

(拜托转载时请用红色加粗字体标明,这是我古今数学思想课的期中论文,免得老师以为我是反过来抄的网上的文章。这门通选课的期中论文要求写数学与自己所在专业之间的联系。)

    我们每天都在说话,每天都在用语言进行交流。语言文字对我们是如此的平常,以至于绝大多数人都不会注意到语言中一些非常难以解释的现象。昨天的汉语虚词研究课上,我们就谈到了这样一个有趣的问题:在表示“仅仅”的含义时,什么时候能够用“只”,什么时候能够用“光”?若不细想的话,大家或许会认为两者的用法完全一样。“我只吃苹果”可以说成“我光吃苹果”,“光有知识还不行”也可以说成是“只有知识还不行”。我们还可以举出更多的例子来,如“别光坐着”/“别只坐着”,“光说不做”/“只说不做”等等。凭借天生的归纳性思维,一个正常人有充分的理由猜想,在表示“仅仅”的含义时,“只”和“光”是通用的。而事实上,现代汉语词典中正是把“光”字解释为“只”。有趣的是,在我们质疑只找了四个例子是否足以说明二者等价时,殊不知这句质疑本身就成了一个反例:“只找了四个例子”不能换成“光找了四个例子”。类似地,“大会只来了748个人”也不能说“大会光来了748个人”。我们继续猜想,是不是“光”不能用在数量词前面呢?也不见得。当数量词不是实指而是虚指时,我们有时也能用“光”来修饰带有数量词的名词。例如,在表示“只吃几个苹果”、“只吃一些苹果”的意义时,“光吃两个苹果”的说法是很顺口的。另一些例子则表明,“光”的用法似乎与它所修饰的名词无关。“我只当到团长”不能说成是“我光当到团长”,但怪就怪在“我只认识团长”却又偏偏可以说成是“我光认识团长”。“当到团长”和“认识团长”有什么不同呢?仔细揣摩两者的意思,我们似乎体会到了一些微妙的差别:“当到团长”是一个阶段性的、进度性的、里程碑性的概念,它必须事先经过“当到连长”、“当到营长”等事件;但“认识团长”就不一样了,没有任何规定限制我们在“认识团长”之前必须“认识连长”。同样的,“找出四个例子”是以“找了三个例子”为前提的,“来了748个人”也不是一下子就能实现的。

    问题算是想通了,但怎么来阐述它呢?在这个问题上,语言学陷入了一个困境。此时,引入数理逻辑语言对于解释这种语言现象出乎意料的方便。我们说,在副词“只”修饰的事件所处的“域”中如果存在蕴含关系,则这里的“只”不能用“光”来替代。例如,提起“吃两个苹果”,我们脑海中形成的事件集合一定是“吃一个苹果”、“吃两个苹果”、“吃三个苹果”等等,而后者必然蕴含前者,因此“只吃两个苹果”不能说成“光吃两个苹果”。类似的,“当到团长”必然推出“当到连长”,但有“认识团长”不见得有“认识连长”,因此两者与“只”和“光”的搭配情况是不同的。

Read more…