一、智慧能源——基於電力行業NLP大模型的設備運檢知識助手示範應用


該應用由百度集團、國網智慧電網研究院有限公司共同開發。

國家電網多年蟬聯世界500強排名前3位、中國500強企業第1位,公司經營區域覆蓋我國26個省(自治區、直轄市),供電範圍佔國土面積的88%,供電人口超過11億,是世界上輸電能力最強、新能源並網規模最大的電網。國網智慧電網研究院作為國家電網的直屬科研機構,在集團公司支援下,長期開展電力自然語言處理、知識圖譜和電力專用大模型的研發,已形成電力分詞、設備技術標準閱讀理解、ICT客服問題識別與定位、設備缺陷定級等技術處理能力,持續推動人工智慧技術與核心業務深度融合應用。

百度“文心”系列大模型涵蓋自然語言處理、視覺、跨模態、生物計算及行業模型,在公開權威語義評測中斬獲了十余項世界冠軍。百度基於領先的深度學習和知識圖譜增強技術,構建了千萬級電力文本樣本庫和電力行業知識圖譜,可實現海量異構數據的整合和智慧化分析應用。

項目面向複雜電網專業場景智慧化需求,基於“文心”大模型聯合訓練電力行業NLP大模型,已在電網設備、ICT客服實際業務場景進行試點驗證。初步結果顯示,相較于傳統小模型技術,電力行業NLP大模型在電力專業分詞任務上,F1指標提升9.27%,達到92.376;電力行業NLP大模型在電力行銷敏感實體識別任務上,F1指標提升13.28%,達到94.947%。基於該項目成果,百度將聯合國網智研院持續開展電力大模型共訓,共同推進電力深層認知智慧提升,助力構建清潔低碳、安全可控、靈活高效、開放互動、智慧友好的新型電力系統。


二、智慧醫療——數字中醫大模型示範應用


該應用由北京智譜華章科技有限公司、北京中醫藥大學東方醫院共同開發。

當前中醫領域存在名醫數量少、傳承斷代、醫療資源不足等問題,名醫經驗的挖掘和整理是當前中醫領域系統性、內涵複雜的一項工程。同時,人工智慧技術的出現,使得“復刻”名老中醫成為可能。北京中醫藥大學東方醫院是國家中醫藥管理局直管單位、三級甲等中醫醫院、首批國家中醫臨床研究基地,積累了大量中醫典籍、處方和中醫臨床數據。

智譜華章高精度千億中英雙語稠密模型“GLM-130B”于2022年8月發佈並開源,在斯坦福大學大模型中心的全球30個主流大模型全方位測評中表現優異,其準確性等關鍵指標與OpenAI、谷歌大腦、微軟和英偉達等公司的大模型接近或持平,全球已有70個國家1000余家機構申請使用。

項目面向中醫領域名醫經驗挖掘整理需求,目標為基於智譜華章GLM-130B大模型,構建數字中醫服務平臺,“復刻”名老中醫診療經驗和學術思想,探索形成與名老中醫高度匹配的高危肺結節人工智慧臨床診療解決方案,完成一定規模的臨床評價研究,實現中醫臨床經驗的智慧化複製新模式。截止目前已初步開發了醫療垂直領域的問答功能,支援對醫療、健康問題進行智慧化知識問答;同時開發了根據症狀生成中醫診方,並提供處方主治症候醫學解釋等輔助診療功能。


三、智慧城市——面向建築領域多模態行業大模型示範應用


該應用由中國科學院自動化研究所、中鐵建設集團有限公司共同開發。

中鐵建設集團是世界500強中國鐵建的房建旗艦企業,正在針對工程建造業務協同中數據多源異構、知識非結構化、管理工具滯後等問題,開展産業升級改造。集團在建項目600余個,在施面積超7000萬平方米,有效整合政府監管、建設、施工、設計、監理、諮詢等多源異構工程數據,積累建築行業規範標準、法律文件、技術方案等電子文件超3萬本,可拆分條文、技術點涵蓋5000萬條,覆蓋建築垂直領域超過10萬個話題的海量專業優質中文語料庫,為多模態大模型在建築領域應用驗證提供了良好的數據基礎。

中科院自動化所“紫東太初”大模型是我國首個實現圖像、文本、語音三模態數據間的統一表示與相互生成的千億級多模態大模型,並實現全棧國産化開發和部署。2023年6月16日,自動化所發佈“紫東太初”2.0全模態大模型,在語音、圖像和文本數據的基礎上,加入視頻、信號、3D點雲等模態數據,突破認知增強的多模態關聯等關鍵技術,形成全模態理解、生成和關聯能力。

項目面向建築領域智慧化需求,基於“紫東太初”多模態大模型和跨模態通用人工智慧平臺,聯合研發建築工程全閉環智慧應用系統,形成項目地圖索引、實時視頻通話、風險快速傳達、問題整改、自動回復等功能,賦能工程方案設計、技術文件審核等多個階段全閉環場景,大大提升建築行業智慧化水準。


四、城市治理一一城市大腦大模型示範應用


該應用由中關村科學城城市大腦股份有限公司自主研發,由科大訊飛(北京)有限公司、中科大腦公司共同完成國産化改造。

中科大腦公司擁有近20年城市數字化建設經驗,建成全國第一個全場景城市大腦,已形成 100多個物聯網+城市治理應用,積累高品質城市治理語料庫規模超 1000 萬條發佈30億參數規模自研大模型“如如ChatTT”,在保證大模型基礎能力的同時,可實現私有化部署,支援知識庫插件框架,可與其他基礎模型互聯,提升基礎模型領域知識的理解和生成能力。

科大訊飛在認知智慧及大模型技術領域有深厚的積累,于2023年5月發佈自研“星火”認知大模型,可通過自然對話方式理解與執行任務,從海量數據和大規模知識中持續進化,自研大模型分佈式訓練框架,同時積極與國內主流模型及國産GPU開展適配,已在辦公、教育等領域實現應用。

項目面向城市治理領域智慧化管理需求和國産化自主可控的安全需求,有效打通科大訊飛“星火”基礎大模型和中科大腦公司“如如ChatTT”行業大模型,針對城市治理數據資源訪問和應用受限、城市治理服務模型通用泛化能力弱以及人工智慧時代下的資訊安全等問題,在如如ChatTT基礎上,完成城市治理大模型的國産化改造並示範應用,加速城市智慧化建設,全面提升城市治理能力。


五、智慧醫療——基於山海大模型的門診病歷生成系統示範應用


該應用由雲知聲智慧科技股份有限公司、北京友誼醫院共同開發。

臨床工作中面臨著繁重的文書撰寫工作,醫護人員大量的精力花費在此項工作上。北京友誼醫院長期探索應用資訊化、智慧化技術提升病歷撰寫和錄入的效率,曾和雲知聲聯合研發並實施了語音電子病歷錄入、超聲助手等效率工具,積累了大量的數據和經驗。

雲知聲長期開展醫療領域智慧應用技術及産品研發,構建了大規模臨床醫學知識圖譜,于2023年5月24日發佈700億參數規模的自研“山海”大模型,具有語言理解與生成、數理能力、代碼能力、知識問答、邏輯推理、插件擴展等十大功能,可用於病歷生成、臨床決策支援、智慧商保理賠等多個場景。

項目面向醫療領域文書撰寫需求,基於雲知聲自研的“山海”大模型、以及前端聲音信號處理、聲紋識別、語音識別、語音合成等全棧式智慧語音交互技術,聯合研發門診醫患對話場景下的電子病歷自動生成系統,實現診室複雜環境下的降噪、醫患角色區分、資訊摘要及病歷自動生成等功能。已建設投資2970萬元,預計可提升醫生的電子病歷錄入效率超過400%,節約單個患者問診時間超過40%,提升醫生門診效率超過66%。


六、科學研究——覆蓋元素週期表原子間勢函數預訓練模型示範應用


該應用由北京科學智慧研究院、中國航發北京航空材料研究院共同開發。

中國航發北京航空材料研究院是我國航空裝備關鍵材料的主要研發及製造單位。航空高性能合金隨著性能的提升,逐漸走向多組元化,導致材料設計空間維度爆炸,難以通過傳統的試錯迭代開發新材料,亟需利用預訓練模型揭示多組元相互作用,突破多組元設計關鍵技術,提高研發效率。

科學智慧研究院在微觀科學計算領域處於國際領先地位,于2022年12月發佈全球首個覆蓋元素週期表近70種元素的深度勢能原子間勢函數預訓練模型DPA-1,該模型雛形曾獲2020年全球高性能計算應用領域最高獎——戈登貝爾獎,可模擬原子規模高至100億,大幅提高模型遷移能力和元素容量,顯著減少建模開銷,縮短研發週期,降低研發成本,已在高性能合金、半導體材料設計等應用場景中實現應用。

項目面向高性能航空關鍵新材料研發需求,基於原子間勢函數預訓練模型DPA-1,在元素覆蓋範圍、計算速度與精度、下游應用驗證等方面開展聯合研發,大幅提升模型的可遷移性、通用性和高效性,在航空高性能合金材料設計場景中降低模型訓練所需數據量及訓練成本,提高模型預測精度。


七、智慧金融——多模態智慧金融大模型示範應用


該應用由第四範式(北京)技術有限公司、北京中關村銀行股份有限公司共同開發。

金融領域面臨著研發、生産、供應鏈、銷售系統、服務系統複雜,數據資訊模態繁多且流轉受限,缺乏具有一定專業性的智慧輔助決策手段等問題。中關村銀行是北京市首家獲中國銀監會批復籌建的民營銀行,也是全國首家專注服務科技創新的銀行,擁有大量的客服反饋問答文本資訊,以及各類監管機構、行業協會法規和銀行內部規章制度,為大模型在金融領域的應用部署提供良好的數據基礎。

第四範式是以平臺為中心的企業級人工智慧領域的領軍企業,針對企業智慧化轉型中面臨的效率、成本、價值、輔助決策等問題,形成了成熟的系列産品和解決方案,已廣泛應用於金融、零售、製造、能源與電力、電信及醫療保健等領域,在中國所有決策型企業級AI市場中排名第一。公司于2023年2月23日發佈的百億參數大模型“式説”,在生成式對話能力基礎上,加入了文本、語音、圖像、表格、視頻等多模態輸入及輸出,可對接金融領域內部語料庫、應用插件庫等,實現對知識問答的快捷生成及溯源。

項目面向金融領域智慧化需求,以第四範式百億參數大模型式説為技術基礎,聯合開展金融多模態智慧金融平臺研發及私有化部署,在行內規章制度及人員資訊查詢、行業術語通俗化解釋、客戶經理信貸管理、人工客服問答推薦、理財業務辦理、AI應用快速研發等多個環節形成大模型能力,大幅降低客服管理成本,提升客服人員效率及客戶滿意度。


八、自動駕駛——自動駕駛大模型DriveGPT示範應用


該應用由毫末智行科技有限公司、長城汽車股份有限公司共同開發。

長城汽車是國內著名的主機廠,汽車年銷量超過100萬輛,目前已經出口到歐洲等地。目前長城旗下20多款車型已裝載毫末智行研發的高階輔助駕駛系統,自動駕駛里程超過6000萬公里,覆蓋全國各類道路和交通場景。由於量産車開放的駕駛場景,給自動駕駛演算法帶來了巨大的挑戰,傳統的小數據小模型模式無法處理如此複雜的環境,只有依靠大模型大數據。

作為國內最早開展自動駕駛大模型研發的公司,針對自動駕駛的業務特點,毫末智行建立了通用感知大模型,通過統一的大模型同時完成圖片紋理、三維重建、圖片語義和實例分割任務,在業界屬於首創。毫末智行又提出並訓練了業界首個自動駕駛生成式預訓練大模型DriveGPT,包含自然語言對話式多模態數據篩選、自動標注、數據生成、數據倣真等功能。

項目面向長城汽車對於高階輔助駕駛實時分析海量數據的技術需求,基於毫末智行自研“DriveGPT”大模型,提供問題場景的快速發現能力、場景數據的快速篩選能力、場景數據的自動標注能力、罕見場景的數據生成能力,以及雲端倣真測評能力。基於大模型的這些能力,毫末智行能有效節省90%的標注成本,將演算法對於模糊車道線的識別能力從40%左右提升到90%以上,對駕駛軌跡的預測誤差降低近3倍。


九、智慧生活——面向消費領域的品商大模型示範應用


該應用由北京銜遠有限公司、北京一輕科技集團有限公司共同開發。

一輕集團在大眾消費産業板塊擁有食品、飲料、樂器等多個品類,普遍存在客戶反饋週期長、反饋渠道不清晰的現狀,隨著産品的多樣化和更新迭代,對利用人工智慧技術進一步挖掘消費需求、及時跟蹤市場變化、加速研發新型産品、精準開展市場行銷等方面都提出了迫切的需求。

銜遠科技是專業從事消費製造業數字化服務的人工智慧創新企業,創始團隊在多模態內容理解與生成、知識表徵與推理、人機對話、可信賴AI等人工智慧基礎理論和前沿技術的研究方面提出了一系列原創理論,並在網際網路與産業數智化方面實現了規模化應用。公司自研的品商大模型是由大規模語言模型、多模態理解模型和圖像生成模型組成的通用大模型,參數規模在百億至千億之間,融合消費、行銷等領域專屬中英文數據,具有消費者洞察與商品洞察、行銷內容的標簽化與智慧生成等功能,已簽約蒙牛、京東等客戶,形成合同訂單。

項目面向消費製造業數字化升級需求,基於銜遠科技品商大模型及ProductGPT等應用,聯合研發形成商品智慧反向定制、預測性生産、智慧調度、智慧行銷等服務功能,並在一輕集團旗下的10 個産品品類示範應用,賦能企業商業模式創新,實現從商機發現到産品交付的全鏈路數智化轉型。


十、智慧問答——智慧問答大模型示範應用


該應用由北京面壁智慧科技有限責任公司、智者四海(北京)技術有限公司共同開發。

作為中國最大問答式線上社區,知乎擁有累計超過5億條的中文網際網路討論與問答內容、覆蓋超過1000多個垂直領域和超過60萬個話題的海量專業優質中文語料庫資源,以及超過1億的月活高知用戶群體,在海量資訊檢索與快速精準聚合、提高用戶獲取資訊效率等方面具有明確的技術需求,是大模型在智慧問答領域的天然應用場景。

面壁智慧技術來源於清華大學電腦係自然語言處理與社會人文計算實驗室,已形成基礎架構、演算法開發、基礎設施等全鏈條大模型技術研發能力,2023年1月發佈自研大模型“CPM-Bee”,當月登頂中文零樣本評測榜單ZeroClue,具備對話生成、自動問答、機器翻譯、自動摘要等十余種能力。

項目面向知乎中文知識問答技術需求,基於面壁智慧自研“CPM-Bee”大模型,聯合開發“知海圖AI”智慧問答大模型,可歸納總結熱榜觀點並生成摘要,生成準確率超過80%,通過多模態、生成式、可解釋及對話式的搜索方式,提升搜索結果的品質和用戶體驗,滿足用戶多樣化的搜索需求,已于2023年4月在知乎實現應用部署。