新一輪財稅改革任務清單公開,小微企業數智化轉型迎來利好 | 首屆“中國青少年應對氣候變化行動”正式啟動 | 力納克推出ELEVATE™升降碼垛解決方案,助力協作機器人提質升級 | 守護用戶權益勢在必行 今日頭條有力推進侵權舉報受理 | 特斯聯入選GEI世界獨角獸企業發展報告2024 | 泰康線上快速啟動陜西多地暴雨災害應急預案 | "為奧運喝彩,匯聚全民能量"大型文體活動在東莞舉行 | 掌握細胞科技密鑰,森普瑞斯解鎖生命無限潛能 | 油車混運背後的兩難:如何破解“不可能三角”的謎題? | 走進「方博碳討室」,看華為 DriveONE iTRACK 是如何讓汽車開起來更「智慧」? |
 
當前位置: 新聞>滾動>

雲天勵飛IPU-X6000:引領大模型推理加速卡新紀元

發佈時間:2024-07-24 14:48:52  |  來源:天極網  |  作者:  |  責任編輯:科學頻道

近期,雲天勵飛推出IPU-X6000加速卡。該産品具備256T算力、128GB顯存容量、486GB/S顯存頻寬;採用C2C Mesh互聯技術,可實現卡間高速互聯,頻寬達64GB/s,最大可實現64張卡的互聯;可應用於語言、視覺、多模態等各類大模型的推理加速,目前已適配雲天天書、通義千問、百川智慧、Llama2/3等近10個主流大模型。IPU-X6000加速卡內置全國産工藝打造的大算力晶片DeepEdge200,該晶片採用D2D Chiplet技術,是基於DeepEdge10晶片平臺打造的最新成果。DeepEdge10是雲天勵飛于2023年底正式發佈的全國産14nm Chiplet大模型推理晶片。IPU-X6000單卡可實現130B參數量大模型推理,在執行70B參數量大模型推理時性能達11 tokens/s,有望在大模型推理領域逐步實現國産替代。

今年以來,大模型全面進入應用落地階段,推理算力需求隨之不斷增長。根據IDC數據,預計到2026年中國數據中心用於推理的負載將達到62.2%。作為國內領先的人工智慧企業,雲天勵飛不僅持續開展晶片、大模型等關鍵核心技術的自主研發工作,也一直持續推進大模型等創新技術的應用落地,在推理算力領域進行了完備的部署。今年雲天勵飛與德元方惠簽署協議,提供總算力規模約4000 PFLOPS的AI訓練及推理異構算力服務,預計未來3年將為雲天勵飛貢獻約16億的營收。雲天勵飛推出的X6000加速卡,專門針對大模型推理任務設計,打造了一系列符合大模型演進趨勢的統一工具鏈,包括分佈式並行策略、基於硬體的流水線排布、先進的量化策略、多機並行的編譯機制等,在同等條件下能夠做到推理性能更高、消耗成本更低。未來X6000將進一步支撐雲天勵飛智算運營業務,為行業帶來更豐富的算力服務。