6月28日至29日,「稀土開發者大會」在北京圓滿落幕,這場為期兩天的盛會以“代碼不止掘金不停”為主題,匯聚了業界精英的璀璨光芒。活動特邀5位重量級主論壇嘉賓、12位卓越出品人以及超過70位技術先鋒,精心策劃了10大前沿主題分論壇,跨越地域界限,攜手引領技術潮流,深入剖析行業最新趨勢與未來發展方向。
作為本次大會的戰略合作夥伴,英特爾不僅在主論壇與分論壇上貢獻了精彩紛呈的內容,更在外部展區大放異彩,聚焦于大模型與genAI的賦能展示。不僅展現了其在推動AI技術革新方面的深厚實力,更為參會者搭建了一個近距離感受未來科技魅力的平臺。
開放生態 賦能創新
英特爾公司副總裁、英特爾中國軟體與先進技術事業部總經理李映在稀土開發者大會主論壇上帶來了主題 《開放生態,賦能創新:英特爾如何通過開源開放推動GenAI産業生態繁榮》。會上,他強調英特爾公司通過技術趨勢引領和開源社區建設,推動社區繁榮,同時在硬體支援和創新項目培育方面發揮著重要作用。英特爾的技術合作釋放了硬體算力,OS優化快速部署,顯著提升了性能,尤其是在veLinux作業系統上的應用性能。通過社區治理和創新項目,展示了硬體級安全方案和資源管理的重要性。英特爾還推動了AI創新應用在多媒體內容生成、教育等領域的發展。
展望2024年,英特爾計劃通過開放生態系統解鎖企業人工智慧,推動異構計算AI加速框架,與Linux Foundation等合作夥伴共同構建開放、標準的多架構加速計算生態系統。英特爾中國將繼續加強全球開源社區合作,加速技術應用創新,推動産業落地,釋放底層算力,實現AI的無處不在。
圖:英特爾公司副總裁、英特爾中國軟體與先進技術事業部總經理李映
在「大模型部署與推理」的分論壇上,英特爾高級軟體工程師繆金成、英特爾AI框架軟體工程師王錫貴分別帶來了《使用英特爾優化工具加速GenAI/LLM應用》以及《英特爾基於transformer的工具集加速LLM》的主題演講。
繆金成首先介紹了至強平臺憑藉其強大的計算能力和可擴展性,在支撐複雜LLM運作方面的獨特優勢。具體而言,通過利用該平臺提供的32個物理核心以及 xFT + vLLM技術,實現了多路併發的卓越效果,顯著提升了模型處理速度與響應能力。他進一步分享了具體的部署經驗,包括如何選擇合適的硬體配置、優化軟體棧以充分利用硬體資源,以及利用部署工具簡化流程、加速部署週期。最終,通過實例展示,驗證了至強平臺在支援高併發、低延遲LLM服務方面的卓越表現。
圖:英特爾高級軟體工程師繆金成
王錫貴著重介紹了英特爾擴展工具包,這是一個為加速Transformer模型而設計的創新工具集。他詳細説明瞭該工具包如何支援模型量化,以減少記憶體佔用同時保持計算精度。並分享了全面的安裝和配置指南,指導用戶如何在不同的作業系統和軟體版本上部署和優化模型。此外,他還列出了工具包支援的大型語言模型,並提供了詳盡的性能數據,展示了這些模型在不同硬體上的表現。
圖:英特爾AI框架軟體工程師王錫貴
在「GenAI技術實踐」分論壇上,英特爾軟體工程師林立凡帶來了主題為《火山引擎g3i實例:基於第五代至強處理器的文生圖實踐》
林立凡在演講中總結了基於英特爾第五代至強處理器在文生圖技術上的實踐突破。他強調了火山g3i實例的架構優勢,特別是Intel AMX技術如何通過硬體加速提升深度學習性能。同時,他介紹了英特爾軟體棧的優化,包括針對PyTorch、TensorFlow等框架的調整及AMX性能優化。通過Huggingface pipeline的實戰案例,展示了這些優化如何在實際應用中提升圖像生成服務的效率。
圖:英特爾軟體工程師林立凡
在「大模型工具鏈的應用與實踐」分論壇上,英特爾AI框架軟體工程師王再勵帶來了主題為《助力PyTorch加速大語言模型》
在演講中他深入剖析了Intel Extension for PyTorch,這一專為強化PyTorch在英特爾平臺上性能的定制優化工具集。王再勵簡明扼要地介紹了三大核心優化策略:算子級優化、自動混合精度加速及數據佈局智慧調整,這些策略協同作用,顯著加速了深度學習模型的訓練與推理過程。針對大型語言模型(LLM)的記憶體瓶頸,王再勵介紹了一系列創新優化方案,涵蓋GEMM計算加速、圖結構優化、權重量化技術、K-V暫存策略優化及高效的分佈式推理方法。他特別強調了SmoothQuant與權重量化技術的應用,這些技術能夠在保持模型精度的同時,大幅提升計算效率。
圖:英特爾AI框架軟體工程師王再勵
展區探秘 科技觸手可及
走進英特爾展區,立刻領略到科技的前沿魅力。展區設計現代且富有科技感。展品展示了英特爾的發展歷程和最新技術成果,還通過豐富的互動體驗,讓參觀者近距離感受科技的魅力。無論是科技愛好者、專業人士還是普通觀眾,都能在這裡找到感興趣的內容,全面了解英特爾如何通過科技創新引領未來。