《现代藏文频率词典》
由西北民族大学卢亚军教授主编,“西北民族大学学术成果出版基金”资助,民族出版社出版的《现代藏文频率词典》日前出版发行。
《现代藏文频率词典》(157.7万字)这部大型工具书,是国家社科基金1998年立项项目《藏文词汇频度统计及其应用研究》(批准号:98BYY020)和2005年立项重点项目《藏语语料库建设研究》(批准号:05AYY001)的主要研究成果之一。
在西北民族大学和清华大学智能技术与系统国家重点实验室的重视与支持下,该项目经课题组全体成员历时8年多时间的共同努力才得以完成。
该项目是一项基础性研究项目,也是一项跨学科的系统工程。在考察、借鉴上百年来国内外对德、英、汉、蒙、藏等语种所作的文字计量研究,特别是各种对中文信息处理和汉语教学与语言学研究产生过重大作用和影响的中文字词频度统计研究成果的基础上,借助先进的计算机技术,应用语言学研究的最新理论和方法以及词汇通用度概念,对创制已有1 300多年历史的藏文,进行比较全面的量化统计、分析与应用研究,在国内外首次实现了基于大型藏文语料库的藏文字符、部件、音节、词汇频度与通用度的统计,具有一定的创新性。
本书的内容共分4个部分:
第一编为《藏文部件频度统计表》《藏文部件频度统计降序表》《藏文元辅音与基字及上下加字字符频度分类统计表》和《藏文部件频率表》;第二编为《藏文字符频率表》;第三编为《藏文语料库音节频率表》和《藏文词典音节频率表》;第四编为《藏文词汇频度词目表》和《藏文词汇频率与通用度统计分析对照表》。
著名语言学家戴庆厦、胡坦、方世增教授和藏文信息技术专家陈玉忠博士都对本项目研究成果给予了充分的肯定与高度的评价。胡坦教授在本书的专家审读意见中说:“藏文是一种与众不同的拼音文字,历史悠久,文献丰富,过去没有人做过大规模的定量统计、定性分析和系统的研究。《现代藏文频率词典》是在大型藏文语料库的基础上,首次实现了对藏文字符、部件、音节、词汇频度与通用度的统计,为藏文信息处理,字符编码、情报检索,机器翻译、文字和语音识别、输入法设计、语言文字教学与研究等诸多领域,提供了很重要的科学数据,奠定了严格的科学基础,使藏文能够借助电子计算机技术更便捷和高效地使用,因而具有重要的学术价值和广泛的应用价值。可以说,为藏文信息处理和语言文字教学与研究填补了一项国内空白。”