西藏人工智能從場景應用走向藏語大模型研發

 【中新社拉薩11月30日電】(記者趙朗)「西藏在藏語大模型研發領域取得了重要進展,標誌著西藏AI發展將從場景應用走向系統性研發階段。」就日前千億級參數藏語基座大模型「陽光清言」V1.0成果發佈,中國工程院院士、西藏大學教授尼瑪扎西30日接受中新社採訪時表示。

 據中新社記者觀察了解,無論在政務領域、社區治理,抑或公共服務、生態科考,人工智能在西藏已有普遍應用。在拉薩,像社區、機場已經接入AI技術,為人們生活帶來便捷。前不久在拉薩舉行的第二次青藏科考成果綜合集成應用發佈會上,「e科考」App受到關注,它能對考察對象進行快速全息解讀,數據能够通過衛星網絡實時上傳至雲端數據庫。

 今年8月,中國國務院印發《關於深入實施「人工智能+」行動的意見》,為西藏人工智能發展提供了更清晰的方向。

 作為西藏人工智能自主研發的成果,「陽光清言」V1.0模型訓練依託約288億Token的高質量藏語數據,涵蓋新聞、法律、醫學、教育、科技等多個領域,包括藏語單語數據、多語種平行語料、雙語辭典條目等豐富內容。

 西藏青年創業者旦增羅布團隊自2018年致力於藏語語料數字化,他告訴中新社記者,團隊已研發出多語種智能翻譯系統、多語種語音識別系統以及多語種OCR識別系統,目前已構建起近7000萬條藏漢平行語料,以及覆蓋140多個國家的多語種語音數據庫。

 據悉,旦增羅布團隊研發的藏語大模型DeepZang,已實現多語種的高質量語義理解、生成與交互,App目前已接入DeepSeek技術生態,在內部測試中,將於今年年底面向公眾上線。◇