好心情心理陪伴數字人 陪伴中國1.8億老人的心理健康 | 大慶油田採油一廠第四作業區:“三個聚焦”整改問題隱患 堅實助力冬季安全生産 | 廣東法牛律師事務所榮登央視,彰顯中國涉外法律服務品牌硬實力! | 中國電信星辰語義大模型正式開源,攜手昇騰共建開源大模型生態 | 《王者榮耀:榮耀之章碎月篇》高燃上演 騰訊視頻匠心打磨國漫新樣本 | 福建長泰:鄉賢文化係鄉情 澤被桑梓促發展 | 國網遼源供電公司:爭創5A級標準化良好行為企業 | 新疆大堅果品質出疆,疆果果成龍年春節堅果零食優選 | 博文視點與知萌簽約“萌叔品書點勢”新欄目 | 百多安:引領醫用材料國産化,助推學術交流發展 |
 
當前位置: 新聞>滾動>

中國電信星辰語義大模型正式開源,攜手昇騰共建開源大模型生態

發佈時間:2024-01-15 09:47:07  |  來源:中國網科學  |  作者:  |  責任編輯:科學頻道

1月10日,中國電信星辰語義大模型TeleChat-7B版本宣佈開源,並開放1T高品質清洗數據集。星辰語義大模型已與昇騰AI基礎軟硬體完成適配,並開源了適配後的代碼。此外,中國電信還將在1月20日開源12B版本模型,擁抱更多開發者共建開源大模型生態。

星辰語義大模型是由中電信人工智慧科技有限公司研發訓練的大語言模型,採用1.5萬億 Tokens中英文高品質語料進行訓練。星辰語義大模型在業界首次提出緩解多輪幻覺的解決方案,通過關鍵資訊注意力增強、知識圖譜強化、多輪知識強化、知識溯源能力四大技術,將AI大模型的幻覺率降低了40%,這有助於大模型變得更有“人味”,真正理解問題語境,告別風馬牛不相及的答案。

目前,星辰語義大模型正在與千行百業的資訊化解決方案進行融合,滿足多樣場景需求。在中國電信內部,星辰語義大模型賦能行文寫作、代碼編程、網路故障分析以及經營分析等場景,以行文寫作為例,其平均生成字數超過1500字,有效採納率達到85.7%;在對外企事業單位客戶的業務中,星辰語義大模型賦能企業經營分析、政務公開諮詢、民生訴求接待等場景,其業務覆蓋率達到95%,多輪理解準確率達到90%。

早在2023年11月,中國電信就在2023數字科技生態大會上發佈了千億參數“星辰語義大模型”,並公佈了後續的開源開放的時間表。本次TeleChat-7B版本開源了對話模型TeleChat-7B-bot,以及其huggingface格式的權重文件。此外,還開源了7B模型的int8和int4量化版本。

可訪問開源倉了解詳情:

Gitee地址:https://gitee.com/Tele-AI/tele-chat

Github地址:https://github.com/Tele-AI/Telechat

在模型開發上,星辰語義大模型已與昇騰AI基礎軟硬體完成適配:支援Atlas 300I pro推理卡,具備int8量化能力,精度與性能表現均與業界第一梯隊持平;支援Atlas訓練伺服器,用戶可使用昇思MindSpore和PyTorch框架進行模型訓練和推理,兩個框架下模型精度與性能均有不俗表現。

除了星辰語義大模型,目前已有50+業界主流大模型基於昇騰訓練迭代,9傢夥伴攜手昇騰發佈了大模型訓推一體機,昇騰以開放易用的平臺使能千模百態,為大模型創新注入動能。

本次星辰語義大模型TeleChat-7B版本開源,夯實了中國電信構建開放生態的重要一環,降低了大模型開發門檻,未來,中國電信將進一步攜手昇騰AI等合作夥伴推動中國大模型在千行百業落地,加速人工智慧産業發展。