随着人类社会交流量的上升,一次交流的上下文就变得丰富起来,很多在单词、单句的条件下很有效率的信息交流方式,也就显得越来越冗余了,因此世界上的各个主要语言纷纷向【孤立语】靠拢。
关于各个语言的表意效率,也就是信息密度,2011年法国里昂大学做了一个实验
http://ohll.ish-lyon.cnrs.fr/fulltext/pellegrino/Pellegrino_2011_Language.pdf这个实验里,研究者找了59位不同语言使用者,其中包括英语、法语、德语、日语、汉语、意大利语和西班牙语。为他们提供了20段文字,这些文字都翻译成各自的语言,然后请这些人分别用正常语速朗读,研究者全程录音,然后研究者计算所有音节数量,计算朗读中表现的义项(表意的基本单位)的数量,最后得出结论
研究的结果是
【汉语】信息密度为0.94,位居 第一
【英语】信息密度为0.91,位居第二
德语(0.79)
法语(0.74)
意大利语(0.72)
西班牙语(0.63)
日语(0.49)
此处信息密度是通过计算每个音节所包含的义项数量来获得的,由于义项的数量是从原始文本——英文版里统计的,翻译之后有可能会增加或减少义项,为防止翻译过程中的扭曲造成数据标准不统一,各个语言的文本都被单独翻译为越南语,然后与各自越南语文本中每个音节所包含的义项数量相除,最终得到比较公平的数据
这让我不由地想到,经过大规模注水的现代汉语信息密度还是这么高,那么文言文究竟已经高到了何种地步?很遗憾没有这方面的研究。