8月2日,记者从青海省海南藏族自治州藏语委办获悉,由该办负责开发的全球首个藏文智能搜索引擎“云藏”(下称“云藏”)开始上线试运行。
“云藏”一词是由藏文而来的音译词,有两层含义,其一为“上师”或“老师”,意为有求必应、有问必答;其二是将其分为单字,有“全面抓取、提取”之意。
“云藏”是青海省少数民族事业“十二五”规划中藏文信息化建设的重要组成部分,于2013年4月启动系统平台项目建设,研发团队现有150余名工作人员,由藏文信息录入组、分词标注组和技术组3个小组组成,团队中藏族比例达87%。
青海省海南藏族自治州藏语委办主任、“云藏”引擎开发负责人才洛介绍,“云藏”旨在满足广大藏文网民个性化检索需求,推动藏文信息化工作迈上新台阶,目前该引擎涵盖新闻、网页、图片、视频搜索基本功能以及百科、文库和问答系统。
据了解,目前中国国内如百度、搜狗等主要的搜索引擎中无藏文搜索功能,国外搜索引擎只支持简单的藏文搜索,如谷歌、雅虎以及微软的bing搜索引擎等。
“由于谷歌、雅虎等数据索引库在国外,检索到的信息准确性和内容有受制性,对应出自国内的真实和有效的信息不能被及时检索,提供的有关藏文化知识准确度不高、信息量不够。”才洛坦言,“目前‘云藏’搜索引擎研发领域内藏文信息处理技术还未完全成熟,还存在着诸多问题和不足,部分功能和内容仍处于调试和扩充阶段,需要不断地改进和完善。”
据初步估算,“云藏”运行初期,青、藏、甘、川、滇五省区的藏文用户数量约为120万,随着搜索引擎产品的推广和宣传,用户量将达200万。
才洛表示,“云藏”建成后对藏文信息安全、国内外涉藏舆情监测以及重要舆情分析将提供可靠的参数和依据。