歷經一個月,首屆通義千問AI挑戰賽圓滿落下帷幕。本屆首屆通義千問AI挑戰賽由阿裏雲和NVIDIA英偉達聯合主辦,魔搭社區、阿裏雲天池平臺、通義千問、CodeFuse支援承辦。
本次大賽設置 Code Qwen能力演算法賽道和 Agent Builder創意挑戰賽道兩個賽道,前者聚焦通義千問大模型的微調訓練,期待通過高品質的數據探索開源模型的代碼能力上限,後者鼓勵開發者基於通義千問大模型和魔搭社區的Agent-Builder框架開發新一代AI應用,促進大模型在各行各業的落地應用。
本次大賽共吸引來自全國1216支隊伍報名,初賽階段共收到351個作品/成績提交,20支隊伍晉級復賽,展現了參賽選手們優秀的技術實力和創造力,最終20支隊伍分享了17.5萬元人民幣的獎金池。
在通義千問AI挑戰賽 - Code Qwen能力演算法賽道上,眾多參賽者憑藉其卓越才智,在激烈的初賽和復賽中表現出色。編程能力是大型模型的關鍵能力之一,高效的生産效率不僅有助於提高有限算力的利用率,也可以加速對模型的迭代,主辦方期待未來有更多基於大型模型的編程助手能夠提高生産效率,成為不可或缺的智慧化工具。
初賽階段,參賽者圍繞1.8B規模的開源Qwen模型進行微調,目標是通過收集高品質數據來增強模型在代碼生成和代碼修復方面的性能。由於1.8B Qwen模型對訓練資源的需求相對較低,參賽者們得以充分發揮創意,積極蒐集和打造高品質的代碼監督數據,以此不斷提高基礎模型的表現。
在眾多團隊中,VSCODE團隊和 JMXGODLZZ團隊表現尤為突出。特別是 JMXGODLZZ團隊,他們借鑒了“Textbook is All you need”論文的方法,採用高品質書籍數據作為一階段訓練,隨後以高品質指令數據進行二階段訓練,成功地將理論研究應用於實戰中。
在復賽中,主辦方提供了基於NVIDIA GPU的訓練資源,參賽者利用NVIDIA TensorRT-LLM等技術棧,在阿裏雲靈積平臺上對72B Qwen模型進行雲端訓練,期待大型模型能夠像頂尖的編程專家那樣在真實 leetcode上進行編程挑戰。復賽期間,yyyyyjjjjj團隊敏銳地意識到“有思路的刷題”對提升模型性能的重要性,他們通過構建大量的leetcode訓練題目及其題解思路來增強模型的解題能力,最終拔得頭籌。
在通義千問AI挑戰賽 - Agent Builder應用賽道上,作品創意涵蓋遊戲、教育、法律、金融、工業等10多個領域,通過技術難度、應用前景、交互體驗、人氣值等維度決選出了10支團隊及其作品來到線下進行復賽路演,最終由技術、業務、投資領域組成的專家團評選出最佳應用獎、最佳創意獎等6個獎項。
在眾多團隊中,“關風月W”的“看得見聽得見的二次元女朋友”項目獲得最佳應用獎,其通過多模態AI,結合文本、圖像、音頻和視頻技術,創造出具有生動個性和強互動體驗的數字人。用戶能夠復刻二次元角色、偶像或親朋的聲音與形象,同時利用先進語言模型定制數字人的特性,提供豐富多樣的互動體驗。
來自“JO了個JO”的“狗血故事無痛背單詞”項目獲“最佳創意獎”,通過AI助手,將英語單詞轉化為容易記憶的有趣小故事,該項目創新性地解決了大規模詞彙記憶的挑戰,使英語學習變得輕鬆有趣。
獲獎名單
Code Qwen能力演算法賽道:
Agent Builder創意挑戰賽道:
在本次大賽中,不論是通過高品質數據微調提升基礎語言模型低代碼能力,還是圍繞場景創作好玩和有用的AI智慧體創意應用,我們都驚喜地看到了開發者們的無限探索力和創造力。