國內大模型實現“長文本”突破應用廣泛

指數發表于：2023-10-11 12:03

通用人工智慧領域初創公司月之暗面（Moonshot AI）近日宣佈在長文本領域實現突破，推出了首個支援輸入20萬漢字的大模型Moonshot以及搭載該模型的智慧助手産品Kimi Chat。

從技術上看，參數量決定了大模型能夠支援多複雜的“計算”，而能夠接收多少文本輸入（即長文本技術）則決定了大模型有多大的“記憶體”，兩者共同決定模型的應用效果。月之暗面相關負責人介紹，支援更長的上下文意味著大模型擁有更大的“記憶體”，從而使得大模型的應用更加深入和廣泛：比如通過多篇財報進行市場分析、處理超長的法務合同、快速梳理多篇文章或多個網頁的關鍵資訊、基於長篇小説設定進行角色扮演等等，都可以在超長文本技術的加持下，成為人們工作和生活的一部分。

相比當前市面上以英文為基礎訓練的大模型服務，月之暗面推出的Kimi Chat具備較強的多語言能力。例如，其在中文上具備顯著優勢，實際使用效果能夠支援約20萬漢字的上下文，8倍于Open AI公司ChatGPT約2.5萬字的上下文支援容量。此前，一些大模型僅支援數萬字的文本量限制使得律師、分析師、諮詢師等需要分析、處理較長文本的工作從業人員使用相關AI應用時頗為苦惱。根據媒體公佈的內測體驗視頻，當上傳一篇長篇小説的電子文檔後，月之暗面研發的Moonshot能夠清晰地梳理一部小説的主要情節及小説中各個主要人物和人物的命運，也可以根據用戶上傳的財報進行關鍵數據和公司發展情況的分析等。目前，月之暗面的智慧助手産品Kimi Chat已開放內測。

今年，中國頂尖AI科研人員之一楊植麟成立月之暗面。楊植麟此前從清華大學畢業後前往美國卡內基梅隆大學攻讀博士，師從蘋果AI研究負責人和谷歌首席科學家。在過去五年內的自然語言處理領域，楊植麟的學術論文在華人學者引用排名中位居前10，在40歲以下華人學者中排名第一。（記者孫奇茹）

來源：北京日報責任編輯：劉松

(原標題：國內大模型實現“長文本”突破)

國內大模型實現“長文本”突破 應用廣泛

國內大模型實現“長文本”突破應用廣泛