11月19日下午,由中国工程院院士、西藏大学教授尼玛扎西团队和北京智谱华章科技股份有限公司联合研发的国内首个面向藏语场景的千亿级参数藏语基座大模型“阳光清言”V1.0成果在拉萨发布。

  据研发团队介绍,模型训练使用了约288亿Token的高质量藏语数据,体量和质量均处于当前国内大模型研究领域藏语语料建设的“第一梯队”。

  在丰富的“知识底座”的加持下,“阳光清言”在藏语智能回答、文本生成、机器翻译等领域有着优异的表现。

  研发团队表示,得益于千亿级参数规模与高质量语料,藏语AI不再只是“大模型世界里的一角”,而是拥有了真正匹配国际主流水平的“超级数字大脑”。

  值得关注的是,“阳光清言”并非单一垂直应用模型,而是面向多行业、多场景的基座大模型。基于这一底座,可面向西藏重点领域衍生出文旅服务、文化传承、藏医药发展与高原健康等一系列行业大模型,为西藏各类行业提供统一的藏语智能底座。

  “阳光清言”藏语大模型的研发,是补齐藏语在智能化发展中长期存在“数据少、算力弱、人才缺”这一短板的重要一步,使得藏语言有机会在新一轮人工智能竞争中,抢占藏语智能领域国际技术话语权。

  研究团队已按照国家相关法规推进备案工作,待完成后将正式上线面向社会服务。