緊握根技術(shù)競速大模型
6月16日,在上海舉行的人工智能框架生態(tài)峰會上,上海昇思人工智能框架和大模型創(chuàng)新中心正式啟動,首批22家單位正式入駐。資料照片
編者按
以大模型為代表的人工智能賽道上,根技術(shù)正在成為決勝的關(guān)鍵。作為當(dāng)前全球科技發(fā)展的重要專項(xiàng),人工智能也是我國的重要戰(zhàn)略先導(dǎo)機(jī)遇。隨著大模型等技術(shù)的商業(yè)化應(yīng)用,人工智能已深度融入生產(chǎn)生活,全球各國都在孵化和孕育各類通用的行業(yè)大模型,要在這一賽道上實(shí)現(xiàn)領(lǐng)先,就必須以底層技術(shù)突破帶動上下游要素集聚,不斷提升核心競爭力。
AI框架:支撐人工智能產(chǎn)業(yè)創(chuàng)新
今年以來,大模型帶火通用人工智能(AI)賽道。作為人工智能領(lǐng)域的根技術(shù),AI框架相當(dāng)于AI領(lǐng)域的操作系統(tǒng)。6月16日,以“一起昇思,無盡創(chuàng)新”為主題的人工智能框架生態(tài)峰會在上海舉行,業(yè)界圍繞大模型與科學(xué)智能領(lǐng)域AI框架技術(shù)展開深度交流,共同探討AI技術(shù)創(chuàng)新與行業(yè)融合大背景下的AI框架生態(tài)模式與場景應(yīng)用,力圖推動人工智能產(chǎn)業(yè)創(chuàng)新。
大模型展現(xiàn)產(chǎn)業(yè)應(yīng)用前景
“我是昇思開源社區(qū)的一名開發(fā)者,‘紫東太初’能否以中國國畫的形式現(xiàn)場生成一幅竹林圖片?”當(dāng)一位現(xiàn)場觀眾提出要求,幾秒鐘后大屏幕上就出現(xiàn)了一幅竹林水墨畫……峰會上,中科院自動化研究所發(fā)布的全模態(tài)大模型“紫東太初”2.0現(xiàn)場展示的圖像生成能力令人驚嘆。
除了支持圖像生成,“紫東太初”2.0還支持多輪問答、文本創(chuàng)作、3D理解、信號分析等跨模態(tài)任務(wù),例如在三維場景里實(shí)現(xiàn)精準(zhǔn)定位、通過圖像與聲音的結(jié)合完成場景分析等。
中科院自動化研究所所長徐波介紹,“紫東太初”全模態(tài)大模型是在多模態(tài)大模型“紫東太初”1.0基礎(chǔ)上升級打造的2.0版本,在語音、圖像和文本三模態(tài)的基礎(chǔ)上,加入視頻、信號、3D點(diǎn)云等模態(tài)數(shù)據(jù),突破了認(rèn)知增強(qiáng)的多模態(tài)關(guān)聯(lián)等關(guān)鍵技術(shù),具備全模態(tài)理解能力、生成能力和關(guān)聯(lián)能力。
“紫東太初”2.0可以理解三維場景、信號等數(shù)字物聯(lián)時代的重要信息,完成了音樂、圖片和視頻等數(shù)據(jù)之間的跨模態(tài)對齊,能夠處理音樂視頻分析、三維導(dǎo)航等多模態(tài)關(guān)聯(lián)應(yīng)用需求,并可實(shí)現(xiàn)音樂、視頻等多模態(tài)內(nèi)容理解和生成。本屆峰會首次對外實(shí)時展示了該模型在音樂理解與生成、三維場景導(dǎo)航、信號理解、多模態(tài)對話等方面的全新功能。
“從1.0到2.0,‘紫東太初’大模型打通了感知、認(rèn)知乃至決策的交互屏障,使人工智能進(jìn)一步感知世界、認(rèn)知世界,從而延伸出更加強(qiáng)大的通用能力。”徐波說。
目前,“紫東太初”大模型在神經(jīng)外科手術(shù)導(dǎo)航、短視頻內(nèi)容審核、法律咨詢、醫(yī)療多模態(tài)鑒別診斷、交通違規(guī)圖像研讀等領(lǐng)域展現(xiàn)出一定的產(chǎn)業(yè)應(yīng)用前景。例如在醫(yī)療場景,“紫東太初”大模型部署于神經(jīng)外科機(jī)器人MicroNeuro,可實(shí)現(xiàn)在術(shù)中實(shí)時融合視覺、觸覺等多模態(tài)信息,協(xié)助醫(yī)生對手術(shù)場景進(jìn)行實(shí)時推理判斷。
據(jù)徐波介紹,基于“紫東太初”2.0的全棧國產(chǎn)化、低代碼一站式開發(fā)的“紫東太初”開放服務(wù)平臺已上線,支持公有云、私有云一鍵部署,使能行業(yè)大模型高效率開發(fā)。“未來3至5年,包括‘紫東太初’在內(nèi)的我國大模型技術(shù),將在促進(jìn)數(shù)字經(jīng)濟(jì)發(fā)展方面發(fā)揮重要作用,進(jìn)一步提升各行業(yè)的勞動生產(chǎn)率。”
AI框架支撐大模型“快跑”
“從算法到硬件、算力,‘紫東太初’都是‘中國造’。”中科院自動化研究所紫東太初大模型研究中心常務(wù)副主任王金橋介紹,大模型算法為中科院自動化研究所自研,以國產(chǎn)化人工智能硬件和框架作為基礎(chǔ),算力則由武漢人工智能計(jì)算中心提供支持,“在國產(chǎn)軟硬件的支撐下,我們的大模型一樣能跑得很好、很快。”
支撐“紫東太初”的人工智能框架正是華為公司的昇思。據(jù)昇思開源社區(qū)理事長丁誠介紹:“人工智能框架是人工智能技術(shù)體系的核心中堅(jiān),向下賦能多樣化算力,通過高效調(diào)度發(fā)揮系統(tǒng)最佳性能;向上孵化各類創(chuàng)新算法模型,給用戶提供便捷的操作接口。”
本屆峰會上,上海昇思人工智能框架和大模型創(chuàng)新中心正式啟動。該創(chuàng)新中心的定位是以華為公司的人工智能框架昇思為基礎(chǔ),支持全國范圍的人工智能技術(shù)企業(yè)、高校與科研院所孵化大模型、研究科學(xué)智能技術(shù),進(jìn)而在互聯(lián)網(wǎng)、金融、教育等關(guān)鍵產(chǎn)業(yè)方向上打造富有競爭力的人工智能應(yīng)用場景,推動產(chǎn)業(yè)集聚。上海人工智能實(shí)驗(yàn)室、上海交通大學(xué)、中國商飛上海飛機(jī)設(shè)計(jì)研究院、中國科學(xué)院上海藥物研究所、云從科技等首批22家單位正式入駐創(chuàng)新中心。入駐單位將聯(lián)合昇思開源社區(qū)進(jìn)行大模型創(chuàng)新與人工智能產(chǎn)學(xué)研轉(zhuǎn)化,助力創(chuàng)新中心成為人工智能技術(shù)與應(yīng)用創(chuàng)新的“發(fā)源地”。
數(shù)據(jù)顯示,華為昇思自2020年3月28日開源以來,社區(qū)已累計(jì)1.3萬貢獻(xiàn)者、474萬下載量,服務(wù)企業(yè)數(shù)量5500家、開源模型400多個,與240家科研院所展開合作,發(fā)表頂級會議論文超過900篇。具體來看,昇思一方面依托大模型和科學(xué)智能創(chuàng)新成果,成立了遙感、流體、多模態(tài)三大產(chǎn)業(yè)聯(lián)合體,加速技術(shù)成果轉(zhuǎn)化;另一方面向端、邊、云全場景開放,適配國內(nèi)主流的人工智能芯片和硬件設(shè)備超過20款。
峰會上,丁誠介紹了昇思開源社區(qū)面向未來的四大創(chuàng)新方向,包括基于“構(gòu)建大模型全流程使能、科學(xué)計(jì)算新范式”的技術(shù)創(chuàng)新,以加速AI新應(yīng)用的孵化;基于“大模型平臺、Study Group、極客周、全球開源生態(tài)”的運(yùn)營創(chuàng)新,讓社區(qū)成果更高效地推廣到用戶;基于“面向?qū)W習(xí)、成長、研究的不同階段開發(fā)者提供不同培養(yǎng)模式”的人才創(chuàng)新,培育AI產(chǎn)業(yè)土壤;以及基于“建立產(chǎn)業(yè)聯(lián)合體、行業(yè)專區(qū)等新手段,持續(xù)完善多樣化算力和硬件支持”的生態(tài)創(chuàng)新。
“科學(xué)智能”成下一個“爆點(diǎn)”
“作為后發(fā)框架,要想技術(shù)超越或者領(lǐng)先,核心就是找到AI技術(shù)變革的下一條新賽道,只有當(dāng)新賽道出現(xiàn)的時候才有超車的機(jī)會。”丁誠表示。
相對于國際上較早開源的AI框架,昇思的確是后來者。早在三年之前,昇思就開始布局大模型技術(shù),也獲得了一系列大模型原生生態(tài)創(chuàng)新成果。那么在下一個時代,新賽道是什么?答案很可能是“科學(xué)智能”。
“在每一個科學(xué)問題里可能都包含著一個基本的數(shù)學(xué)方程。例如在流體力學(xué)計(jì)算中會大量消耗算力,但其實(shí)數(shù)學(xué)原理很簡單,就是一個納維-斯托克斯方程的求解。如果用傳統(tǒng)方法計(jì)算可能需要幾十年、上百年算不完的問題,用AI的方式就有可能10倍或者100倍地加速求解。”丁誠解釋。
據(jù)業(yè)內(nèi)人士介紹,從最新的國際頂級期刊不難發(fā)現(xiàn),從人工智能驅(qū)動的蛋白質(zhì)功能機(jī)理探索和理性設(shè)計(jì),到基于人工智能的藥物發(fā)現(xiàn)和藥物優(yōu)化,從酶改造與生物基化學(xué)品的生成,再到科學(xué)育種與氣象預(yù)測——不論是微觀世界的多尺度探索,還是宏觀、微觀科學(xué)成果的應(yīng)用,人工智能求解高維函數(shù)、解決復(fù)雜問題的優(yōu)勢正在持續(xù)釋放。從生命體的基本組成到世界工業(yè)的基本要素,人工智能不僅是解決具體問題的有力工具,更成為重新定義科學(xué)問題的系統(tǒng)性思路。
本屆峰會上,中國科學(xué)院張東輝院士的主題演講《關(guān)于昇思MindSpore在計(jì)算化學(xué)中應(yīng)用的設(shè)想》介紹了與昇思團(tuán)隊(duì)合作研發(fā)高性能水團(tuán)簇分子勢能模型,借助AI之力揭示水的種種特性。
“在昇思發(fā)布的2.0版本當(dāng)中提出了科學(xué)計(jì)算融合架構(gòu),目的就是在這個新賽道里獲得更多的技術(shù)領(lǐng)先機(jī)會,打造自己的原生生態(tài)。”丁誠表示。
大模型:加快創(chuàng)新策源賦能實(shí)體經(jīng)濟(jì)
科技部新一代人工智能發(fā)展研究中心等機(jī)構(gòu)發(fā)布的數(shù)據(jù)顯示,中國10億參數(shù)規(guī)模以上的大模型已發(fā)布79個。這一席卷科技界的AI革命,將如何改變世界?大模型又將如何一手促進(jìn)創(chuàng)新策源,一手服務(wù)實(shí)體經(jīng)濟(jì)?
大模型探索大應(yīng)用
在位于上海臨港新片區(qū)的商湯科技智算中心一樓展示大廳,可以和大模型“商量”,用中文“商量”一下。
記者在現(xiàn)場感受發(fā)現(xiàn),作為千億級參數(shù)的自然語言處理模型“商量”,它不僅可以進(jìn)行多輪對話、人機(jī)共創(chuàng)童話故事,還可以自動生成簡單代碼、進(jìn)行“文生圖”等。例如,在輸入了20張“港風(fēng)”照片后,生成式AI就可以自動生成一張類似風(fēng)格的“氛圍感”圖片。
“無論是讓大模型寫出一首質(zhì)量過關(guān)的古詩,還是根據(jù)描述生成圖像,都要求其對中文語言的理解足夠深刻。這需要經(jīng)過多輪對話的訓(xùn)練,包括輔助語料的投喂,才能逐漸讓模型理解漢語的規(guī)律。”商湯科技首席科學(xué)家王曉剛說。
語言類大模型不是唯一形態(tài),多種通用大模型正在持續(xù)拓展應(yīng)用場景?萍疾啃乱淮斯ぶ悄馨l(fā)展研究中心等機(jī)構(gòu)發(fā)布的《中國人工智能大模型地圖研究報(bào)告》顯示,中國研發(fā)的大模型數(shù)量排名全球第二,僅次于美國。
一方面大模型從辦公、生活、娛樂向醫(yī)療、教育、設(shè)計(jì)等行業(yè)加速滲透;另一方面,一些垂直專業(yè)類大模型不斷深化落地,生物制藥、遙感、氣象等大模型正在發(fā)揮縱深優(yōu)勢。
4月初,上海人工智能實(shí)驗(yàn)室聯(lián)合中國科學(xué)技術(shù)大學(xué)、上海交通大學(xué)、南京信息工程大學(xué)、中國科學(xué)院大氣物理研究所及上海中心氣象臺發(fā)布全球中期天氣預(yù)報(bào)大模型“風(fēng)烏”,30秒生成未來10天全球氣象高精度預(yù)報(bào)結(jié)果。
在氣象氣候預(yù)報(bào)任務(wù)中,全球中期天氣預(yù)報(bào)是重要預(yù)測任務(wù)之一,它以預(yù)測未來14天內(nèi)的大氣系統(tǒng)狀態(tài)為目標(biāo)。“風(fēng)烏”在預(yù)報(bào)精度上降低了誤差,在時效上突破了10天,而且僅需單GPU(圖形處理器)便可運(yùn)行。
上海人工智能實(shí)驗(yàn)室領(lǐng)軍科學(xué)家歐陽萬里說:“‘風(fēng)烏’取名自秦漢時期的‘相風(fēng)銅烏’,是世界上最早的測風(fēng)設(shè)備。天氣預(yù)報(bào)大模型‘風(fēng)烏’承載中國古人的智慧,也寓意實(shí)驗(yàn)室致力于在以氣象為代表的人工智能服務(wù)科學(xué)領(lǐng)域不懈探索。”
大算力搭建新“底座”
出臺支持舉措、整合創(chuàng)新資源、布局新興賽道……近段時間以來,各地都在為人工智能的創(chuàng)新策源“鋪路”。
5月30日,北京發(fā)布《北京市加快建設(shè)具有全球影響力的人工智能創(chuàng)新策源地實(shí)施方案(2023-2025年)》《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施》等方案;深圳發(fā)布關(guān)于加快推動人工智能高質(zhì)量發(fā)展高水平應(yīng)用行動方案;上海市經(jīng)信委表示,超大規(guī)模預(yù)訓(xùn)練模型是人工智能從專業(yè)智能走向通用智能的關(guān)鍵技術(shù),未來將加快研究打造大模型生態(tài)集聚和創(chuàng)新應(yīng)用高地,推進(jìn)算力資源統(tǒng)一調(diào)度。
算力是研發(fā)大模型必不可少的基礎(chǔ)設(shè)施,已成為不少城市爭相布局的焦點(diǎn)。“近期生成式人工智能等應(yīng)用大爆發(fā),推動了算力需求激增。很多企業(yè)在落戶前都會問,算力需求能否被滿足,這已是一種稀缺資源。”上海臨港新片區(qū)管委會高科處處長陸瑜說,這也是臨港發(fā)力構(gòu)建更為完善的算力產(chǎn)業(yè)生態(tài)、搭建公共平臺的初衷。
瞄準(zhǔn)產(chǎn)業(yè)痛點(diǎn),智能算力更需要一體化調(diào)度、經(jīng)濟(jì)化使用。專家認(rèn)為,“東數(shù)西算”工程的全面實(shí)施,將一手促進(jìn)東部數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)鏈向西部延伸拓展,一手讓算力資源精準(zhǔn)配置和按需獲取,有效降低能源消耗。
“我們將在貴安新區(qū)共同合作建設(shè)新的產(chǎn)業(yè)園區(qū),來打造滬黔科技創(chuàng)新成果的轉(zhuǎn)化中心。”貴陽市市長馬寧宇說,貴安正在規(guī)劃建設(shè)全國規(guī)模最大,存算能力一流的高安全、高可靠、高可用的數(shù)據(jù)中心集群,為大數(shù)據(jù)、大算力、大模型的技術(shù)發(fā)展和應(yīng)用提供廣闊空間。
“東西合作有更多想象空間。”優(yōu)刻得科技股份有限公司副總裁劉杰認(rèn)為,“東數(shù)西算”工程可以解決算力問題,在GPU運(yùn)算中,西部成本比東部便宜一半。業(yè)內(nèi)其實(shí)也在探索“東數(shù)西訓(xùn)”,把非實(shí)時計(jì)算的AI訓(xùn)練過程放在西部進(jìn)行,涉及需要實(shí)時運(yùn)算的推理過程則在東部直接完成,更好地調(diào)度算力、節(jié)約成本。
設(shè)規(guī)則促進(jìn)“好模型”
既為創(chuàng)新“加油”,也為發(fā)展“立規(guī)”。專家認(rèn)為,目前大模型總體人才不足,不少應(yīng)用領(lǐng)域還未有成熟開發(fā),數(shù)據(jù)治理也有待提升,這既需要政府部門為創(chuàng)新的落地搭平臺、找場景,也需要為其安全探索設(shè)置好邊界。
今年4月,國家網(wǎng)信辦發(fā)布《生成式人工智能服務(wù)管理辦法(征求意見稿)》,對用于生成式人工智能產(chǎn)品的預(yù)訓(xùn)練、優(yōu)化訓(xùn)練數(shù)據(jù)提出明確要求。從治理原則到倫理規(guī)范,近年來我國一直加強(qiáng)對人工智能行業(yè)“立規(guī)”。
“大模型推動人工智能實(shí)現(xiàn)一次歷史性跨越,中國經(jīng)濟(jì)社會高質(zhì)量發(fā)展為大模型創(chuàng)新提供豐富場景和數(shù)據(jù)基礎(chǔ)。”中國科學(xué)技術(shù)信息研究所所長、科技部新一代人工智能發(fā)展研究中心主任趙志耘認(rèn)為,未來需要在四個方面著力:加強(qiáng)資源和研發(fā)力量統(tǒng)籌,促進(jìn)產(chǎn)學(xué)研合作與開源開放;加強(qiáng)大模型技術(shù)研發(fā),提升學(xué)術(shù)和開源影響力;強(qiáng)化大模型發(fā)展中的場景牽引作用,打造大模型標(biāo)桿項(xiàng)目;強(qiáng)化政策支持和配套服務(wù),加快推動大模型應(yīng)用落地。
從更深層次看,助力大模型走深走透,還需要更高質(zhì)量的數(shù)據(jù)庫。“未來對數(shù)據(jù)的高質(zhì)量和多維度要求都會更高。”中國人工智能開源軟件發(fā)展聯(lián)盟副理事長王健宗說,比如以前標(biāo)注一張圖,只需要說這是“一個公園”;但現(xiàn)在標(biāo)注就需要詳細(xì)描述為“母親和小孩在公園里散步”,標(biāo)注難度和工作數(shù)量級呈指數(shù)上升。
“數(shù)據(jù)變成必要的生產(chǎn)要素后,怎么安全合理地使用,是政府必須考慮的問題。以后對數(shù)據(jù)的質(zhì)量要求、使用門檻都會越來越高,需要規(guī)則的提前制定。”趙志耘說。
大算力:為大模型搭建“高速路”
以ChatGPT為代表的人工智能技術(shù)發(fā)展,引發(fā)了全球算力需求的進(jìn)一步增長。迎接新一輪人工智能熱潮,中國的算力增長點(diǎn)在哪里?什么樣的算力更精準(zhǔn)高效?記者日前采訪業(yè)內(nèi)專家,前瞻算力發(fā)展趨勢。
在全球新一輪人工智能技術(shù)發(fā)展浪潮中,大模型是一個關(guān)鍵詞。ChatGPT等正是通過大模型來“學(xué)習(xí)”海量數(shù)據(jù),并由此取得突破。
中國科學(xué)院院士陳潤生表示,人工智能大模型在應(yīng)用層面正在發(fā)生巨大變化,未來將在多個領(lǐng)域引發(fā)變革,同時也會消耗大量算力。
中國工程院院士鄭緯民說,做大模型必須要有“大算力”,ChatGPT正是基于大規(guī)模算力基礎(chǔ)設(shè)施的產(chǎn)物。
不久前舉行的中關(guān)村論壇上,科技部新一代人工智能發(fā)展研究中心發(fā)布了《中國人工智能大模型地圖研究報(bào)告》。報(bào)告顯示,我國研發(fā)的大模型數(shù)量排名全球第二。
中國科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心研究員陸忠華表示,全社會對算力的需求日益增長,人工智能應(yīng)用的算力需求更加突出,要迎接好這一趨勢。
近年來,我國人工智能算力的占比在升高。“根據(jù)估算,人工智能算力過去幾年大體上年均增長率為70%,其他算力大概增長30%左右。”中國信息通信研究院院長余曉暉說。
清華大學(xué)計(jì)算機(jī)系教授陳文光也觀察到,隨著人工智能的滲透程度加深,相比傳統(tǒng)超算中心,智算中心的利用率變得更高。
國家高性能計(jì)算機(jī)工程技術(shù)研究中心副主任曹振南則表示,雖然算力常被分為超算和人工智能計(jì)算,但二者有許多相像之處,最大區(qū)別在于對計(jì)算精度的要求不同。
“目前人工智能算力的缺口較大,一些人工智能應(yīng)用為追求計(jì)算性能而降低了精度要求。但如果算力變得易得、便宜,一些人工智能應(yīng)用可能又會對精度提出一些高要求。”曹振南說。
專家認(rèn)為,“通用算力+專用算力”將成為人工智能算力基礎(chǔ)設(shè)施的建設(shè)關(guān)鍵。一方面要滿足廣泛的應(yīng)用場景,具備普適性,實(shí)現(xiàn)通用;另一方面也能支持部分對計(jì)算精度、效率要求高的個性化應(yīng)用場景,具備高效性,實(shí)現(xiàn)專用。
在專家看來,將已有的、不同體系架構(gòu)的算力中心通過網(wǎng)絡(luò)連接起來,可以合理配置、共享、調(diào)度、釋放更多算力,并降低應(yīng)用門檻。
在科技部高新技術(shù)司的牽頭下,國家超算互聯(lián)網(wǎng)工作已經(jīng)啟動。按照規(guī)劃,到2025年底,國家超算互聯(lián)網(wǎng)將成為支撐數(shù)字中國建設(shè)的“高速路”。
曹振南介紹,超算互聯(lián)網(wǎng)平臺的建設(shè)目標(biāo)之一,正是致力于解決算力設(shè)施分布不均衡的問題,實(shí)現(xiàn)算力資源的互聯(lián)互通、資源共享。
中國科學(xué)院院士錢德沛表示,算力基礎(chǔ)設(shè)施提供的應(yīng)當(dāng)不僅是算力,更要有用戶所需的軟件或應(yīng)用服務(wù),這樣才能將算力資源最大化。
“希望超算算力未來能像電力一樣走進(jìn)千家萬戶,任何地方、任何時間都可以獲得大數(shù)據(jù)算力來支持相關(guān)應(yīng)用。”錢德沛說。(記者 吳蔚 周琳 楊有宗 潘德鑫 董瑞豐)
6月16日,在上海舉行的人工智能框架生態(tài)峰會上,上海昇思人工智能框架和大模型創(chuàng)新中心正式啟動,首批22家單位正式入駐。資料照片
編者按
以大模型為代表的人工智能賽道上,根技術(shù)正在成為決勝的關(guān)鍵。作為當(dāng)前全球科技發(fā)展的重要專項(xiàng),人工智能也是我國的重要戰(zhàn)略先導(dǎo)機(jī)遇。隨著大模型等技術(shù)的商業(yè)化應(yīng)用,人工智能已深度融入生產(chǎn)生活,全球各國都在孵化和孕育各類通用的行業(yè)大模型,要在這一賽道上實(shí)現(xiàn)領(lǐng)先,就必須以底層技術(shù)突破帶動上下游要素集聚,不斷提升核心競爭力。
AI框架:支撐人工智能產(chǎn)業(yè)創(chuàng)新
今年以來,大模型帶火通用人工智能(AI)賽道。作為人工智能領(lǐng)域的根技術(shù),AI框架相當(dāng)于AI領(lǐng)域的操作系統(tǒng)。6月16日,以“一起昇思,無盡創(chuàng)新”為主題的人工智能框架生態(tài)峰會在上海舉行,業(yè)界圍繞大模型與科學(xué)智能領(lǐng)域AI框架技術(shù)展開深度交流,共同探討AI技術(shù)創(chuàng)新與行業(yè)融合大背景下的AI框架生態(tài)模式與場景應(yīng)用,力圖推動人工智能產(chǎn)業(yè)創(chuàng)新。
大模型展現(xiàn)產(chǎn)業(yè)應(yīng)用前景
“我是昇思開源社區(qū)的一名開發(fā)者,‘紫東太初’能否以中國國畫的形式現(xiàn)場生成一幅竹林圖片?”當(dāng)一位現(xiàn)場觀眾提出要求,幾秒鐘后大屏幕上就出現(xiàn)了一幅竹林水墨畫……峰會上,中科院自動化研究所發(fā)布的全模態(tài)大模型“紫東太初”2.0現(xiàn)場展示的圖像生成能力令人驚嘆。
除了支持圖像生成,“紫東太初”2.0還支持多輪問答、文本創(chuàng)作、3D理解、信號分析等跨模態(tài)任務(wù),例如在三維場景里實(shí)現(xiàn)精準(zhǔn)定位、通過圖像與聲音的結(jié)合完成場景分析等。
中科院自動化研究所所長徐波介紹,“紫東太初”全模態(tài)大模型是在多模態(tài)大模型“紫東太初”1.0基礎(chǔ)上升級打造的2.0版本,在語音、圖像和文本三模態(tài)的基礎(chǔ)上,加入視頻、信號、3D點(diǎn)云等模態(tài)數(shù)據(jù),突破了認(rèn)知增強(qiáng)的多模態(tài)關(guān)聯(lián)等關(guān)鍵技術(shù),具備全模態(tài)理解能力、生成能力和關(guān)聯(lián)能力。
“紫東太初”2.0可以理解三維場景、信號等數(shù)字物聯(lián)時代的重要信息,完成了音樂、圖片和視頻等數(shù)據(jù)之間的跨模態(tài)對齊,能夠處理音樂視頻分析、三維導(dǎo)航等多模態(tài)關(guān)聯(lián)應(yīng)用需求,并可實(shí)現(xiàn)音樂、視頻等多模態(tài)內(nèi)容理解和生成。本屆峰會首次對外實(shí)時展示了該模型在音樂理解與生成、三維場景導(dǎo)航、信號理解、多模態(tài)對話等方面的全新功能。
“從1.0到2.0,‘紫東太初’大模型打通了感知、認(rèn)知乃至決策的交互屏障,使人工智能進(jìn)一步感知世界、認(rèn)知世界,從而延伸出更加強(qiáng)大的通用能力。”徐波說。
目前,“紫東太初”大模型在神經(jīng)外科手術(shù)導(dǎo)航、短視頻內(nèi)容審核、法律咨詢、醫(yī)療多模態(tài)鑒別診斷、交通違規(guī)圖像研讀等領(lǐng)域展現(xiàn)出一定的產(chǎn)業(yè)應(yīng)用前景。例如在醫(yī)療場景,“紫東太初”大模型部署于神經(jīng)外科機(jī)器人MicroNeuro,可實(shí)現(xiàn)在術(shù)中實(shí)時融合視覺、觸覺等多模態(tài)信息,協(xié)助醫(yī)生對手術(shù)場景進(jìn)行實(shí)時推理判斷。
據(jù)徐波介紹,基于“紫東太初”2.0的全棧國產(chǎn)化、低代碼一站式開發(fā)的“紫東太初”開放服務(wù)平臺已上線,支持公有云、私有云一鍵部署,使能行業(yè)大模型高效率開發(fā)。“未來3至5年,包括‘紫東太初’在內(nèi)的我國大模型技術(shù),將在促進(jìn)數(shù)字經(jīng)濟(jì)發(fā)展方面發(fā)揮重要作用,進(jìn)一步提升各行業(yè)的勞動生產(chǎn)率。”
AI框架支撐大模型“快跑”
“從算法到硬件、算力,‘紫東太初’都是‘中國造’。”中科院自動化研究所紫東太初大模型研究中心常務(wù)副主任王金橋介紹,大模型算法為中科院自動化研究所自研,以國產(chǎn)化人工智能硬件和框架作為基礎(chǔ),算力則由武漢人工智能計(jì)算中心提供支持,“在國產(chǎn)軟硬件的支撐下,我們的大模型一樣能跑得很好、很快。”
支撐“紫東太初”的人工智能框架正是華為公司的昇思。據(jù)昇思開源社區(qū)理事長丁誠介紹:“人工智能框架是人工智能技術(shù)體系的核心中堅(jiān),向下賦能多樣化算力,通過高效調(diào)度發(fā)揮系統(tǒng)最佳性能;向上孵化各類創(chuàng)新算法模型,給用戶提供便捷的操作接口。”
本屆峰會上,上海昇思人工智能框架和大模型創(chuàng)新中心正式啟動。該創(chuàng)新中心的定位是以華為公司的人工智能框架昇思為基礎(chǔ),支持全國范圍的人工智能技術(shù)企業(yè)、高校與科研院所孵化大模型、研究科學(xué)智能技術(shù),進(jìn)而在互聯(lián)網(wǎng)、金融、教育等關(guān)鍵產(chǎn)業(yè)方向上打造富有競爭力的人工智能應(yīng)用場景,推動產(chǎn)業(yè)集聚。上海人工智能實(shí)驗(yàn)室、上海交通大學(xué)、中國商飛上海飛機(jī)設(shè)計(jì)研究院、中國科學(xué)院上海藥物研究所、云從科技等首批22家單位正式入駐創(chuàng)新中心。入駐單位將聯(lián)合昇思開源社區(qū)進(jìn)行大模型創(chuàng)新與人工智能產(chǎn)學(xué)研轉(zhuǎn)化,助力創(chuàng)新中心成為人工智能技術(shù)與應(yīng)用創(chuàng)新的“發(fā)源地”。
數(shù)據(jù)顯示,華為昇思自2020年3月28日開源以來,社區(qū)已累計(jì)1.3萬貢獻(xiàn)者、474萬下載量,服務(wù)企業(yè)數(shù)量5500家、開源模型400多個,與240家科研院所展開合作,發(fā)表頂級會議論文超過900篇。具體來看,昇思一方面依托大模型和科學(xué)智能創(chuàng)新成果,成立了遙感、流體、多模態(tài)三大產(chǎn)業(yè)聯(lián)合體,加速技術(shù)成果轉(zhuǎn)化;另一方面向端、邊、云全場景開放,適配國內(nèi)主流的人工智能芯片和硬件設(shè)備超過20款。
峰會上,丁誠介紹了昇思開源社區(qū)面向未來的四大創(chuàng)新方向,包括基于“構(gòu)建大模型全流程使能、科學(xué)計(jì)算新范式”的技術(shù)創(chuàng)新,以加速AI新應(yīng)用的孵化;基于“大模型平臺、Study Group、極客周、全球開源生態(tài)”的運(yùn)營創(chuàng)新,讓社區(qū)成果更高效地推廣到用戶;基于“面向?qū)W習(xí)、成長、研究的不同階段開發(fā)者提供不同培養(yǎng)模式”的人才創(chuàng)新,培育AI產(chǎn)業(yè)土壤;以及基于“建立產(chǎn)業(yè)聯(lián)合體、行業(yè)專區(qū)等新手段,持續(xù)完善多樣化算力和硬件支持”的生態(tài)創(chuàng)新。
“科學(xué)智能”成下一個“爆點(diǎn)”
“作為后發(fā)框架,要想技術(shù)超越或者領(lǐng)先,核心就是找到AI技術(shù)變革的下一條新賽道,只有當(dāng)新賽道出現(xiàn)的時候才有超車的機(jī)會。”丁誠表示。
相對于國際上較早開源的AI框架,昇思的確是后來者。早在三年之前,昇思就開始布局大模型技術(shù),也獲得了一系列大模型原生生態(tài)創(chuàng)新成果。那么在下一個時代,新賽道是什么?答案很可能是“科學(xué)智能”。
“在每一個科學(xué)問題里可能都包含著一個基本的數(shù)學(xué)方程。例如在流體力學(xué)計(jì)算中會大量消耗算力,但其實(shí)數(shù)學(xué)原理很簡單,就是一個納維-斯托克斯方程的求解。如果用傳統(tǒng)方法計(jì)算可能需要幾十年、上百年算不完的問題,用AI的方式就有可能10倍或者100倍地加速求解。”丁誠解釋。
據(jù)業(yè)內(nèi)人士介紹,從最新的國際頂級期刊不難發(fā)現(xiàn),從人工智能驅(qū)動的蛋白質(zhì)功能機(jī)理探索和理性設(shè)計(jì),到基于人工智能的藥物發(fā)現(xiàn)和藥物優(yōu)化,從酶改造與生物基化學(xué)品的生成,再到科學(xué)育種與氣象預(yù)測——不論是微觀世界的多尺度探索,還是宏觀、微觀科學(xué)成果的應(yīng)用,人工智能求解高維函數(shù)、解決復(fù)雜問題的優(yōu)勢正在持續(xù)釋放。從生命體的基本組成到世界工業(yè)的基本要素,人工智能不僅是解決具體問題的有力工具,更成為重新定義科學(xué)問題的系統(tǒng)性思路。
本屆峰會上,中國科學(xué)院張東輝院士的主題演講《關(guān)于昇思MindSpore在計(jì)算化學(xué)中應(yīng)用的設(shè)想》介紹了與昇思團(tuán)隊(duì)合作研發(fā)高性能水團(tuán)簇分子勢能模型,借助AI之力揭示水的種種特性。
“在昇思發(fā)布的2.0版本當(dāng)中提出了科學(xué)計(jì)算融合架構(gòu),目的就是在這個新賽道里獲得更多的技術(shù)領(lǐng)先機(jī)會,打造自己的原生生態(tài)。”丁誠表示。
大模型:加快創(chuàng)新策源賦能實(shí)體經(jīng)濟(jì)
科技部新一代人工智能發(fā)展研究中心等機(jī)構(gòu)發(fā)布的數(shù)據(jù)顯示,中國10億參數(shù)規(guī)模以上的大模型已發(fā)布79個。這一席卷科技界的AI革命,將如何改變世界?大模型又將如何一手促進(jìn)創(chuàng)新策源,一手服務(wù)實(shí)體經(jīng)濟(jì)?
大模型探索大應(yīng)用
在位于上海臨港新片區(qū)的商湯科技智算中心一樓展示大廳,可以和大模型“商量”,用中文“商量”一下。
記者在現(xiàn)場感受發(fā)現(xiàn),作為千億級參數(shù)的自然語言處理模型“商量”,它不僅可以進(jìn)行多輪對話、人機(jī)共創(chuàng)童話故事,還可以自動生成簡單代碼、進(jìn)行“文生圖”等。例如,在輸入了20張“港風(fēng)”照片后,生成式AI就可以自動生成一張類似風(fēng)格的“氛圍感”圖片。
“無論是讓大模型寫出一首質(zhì)量過關(guān)的古詩,還是根據(jù)描述生成圖像,都要求其對中文語言的理解足夠深刻。這需要經(jīng)過多輪對話的訓(xùn)練,包括輔助語料的投喂,才能逐漸讓模型理解漢語的規(guī)律。”商湯科技首席科學(xué)家王曉剛說。
語言類大模型不是唯一形態(tài),多種通用大模型正在持續(xù)拓展應(yīng)用場景?萍疾啃乱淮斯ぶ悄馨l(fā)展研究中心等機(jī)構(gòu)發(fā)布的《中國人工智能大模型地圖研究報(bào)告》顯示,中國研發(fā)的大模型數(shù)量排名全球第二,僅次于美國。
一方面大模型從辦公、生活、娛樂向醫(yī)療、教育、設(shè)計(jì)等行業(yè)加速滲透;另一方面,一些垂直專業(yè)類大模型不斷深化落地,生物制藥、遙感、氣象等大模型正在發(fā)揮縱深優(yōu)勢。
4月初,上海人工智能實(shí)驗(yàn)室聯(lián)合中國科學(xué)技術(shù)大學(xué)、上海交通大學(xué)、南京信息工程大學(xué)、中國科學(xué)院大氣物理研究所及上海中心氣象臺發(fā)布全球中期天氣預(yù)報(bào)大模型“風(fēng)烏”,30秒生成未來10天全球氣象高精度預(yù)報(bào)結(jié)果。
在氣象氣候預(yù)報(bào)任務(wù)中,全球中期天氣預(yù)報(bào)是重要預(yù)測任務(wù)之一,它以預(yù)測未來14天內(nèi)的大氣系統(tǒng)狀態(tài)為目標(biāo)。“風(fēng)烏”在預(yù)報(bào)精度上降低了誤差,在時效上突破了10天,而且僅需單GPU(圖形處理器)便可運(yùn)行。
上海人工智能實(shí)驗(yàn)室領(lǐng)軍科學(xué)家歐陽萬里說:“‘風(fēng)烏’取名自秦漢時期的‘相風(fēng)銅烏’,是世界上最早的測風(fēng)設(shè)備。天氣預(yù)報(bào)大模型‘風(fēng)烏’承載中國古人的智慧,也寓意實(shí)驗(yàn)室致力于在以氣象為代表的人工智能服務(wù)科學(xué)領(lǐng)域不懈探索。”
大算力搭建新“底座”
出臺支持舉措、整合創(chuàng)新資源、布局新興賽道……近段時間以來,各地都在為人工智能的創(chuàng)新策源“鋪路”。
5月30日,北京發(fā)布《北京市加快建設(shè)具有全球影響力的人工智能創(chuàng)新策源地實(shí)施方案(2023-2025年)》《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施》等方案;深圳發(fā)布關(guān)于加快推動人工智能高質(zhì)量發(fā)展高水平應(yīng)用行動方案;上海市經(jīng)信委表示,超大規(guī)模預(yù)訓(xùn)練模型是人工智能從專業(yè)智能走向通用智能的關(guān)鍵技術(shù),未來將加快研究打造大模型生態(tài)集聚和創(chuàng)新應(yīng)用高地,推進(jìn)算力資源統(tǒng)一調(diào)度。
算力是研發(fā)大模型必不可少的基礎(chǔ)設(shè)施,已成為不少城市爭相布局的焦點(diǎn)。“近期生成式人工智能等應(yīng)用大爆發(fā),推動了算力需求激增。很多企業(yè)在落戶前都會問,算力需求能否被滿足,這已是一種稀缺資源。”上海臨港新片區(qū)管委會高科處處長陸瑜說,這也是臨港發(fā)力構(gòu)建更為完善的算力產(chǎn)業(yè)生態(tài)、搭建公共平臺的初衷。
瞄準(zhǔn)產(chǎn)業(yè)痛點(diǎn),智能算力更需要一體化調(diào)度、經(jīng)濟(jì)化使用。專家認(rèn)為,“東數(shù)西算”工程的全面實(shí)施,將一手促進(jìn)東部數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)鏈向西部延伸拓展,一手讓算力資源精準(zhǔn)配置和按需獲取,有效降低能源消耗。
“我們將在貴安新區(qū)共同合作建設(shè)新的產(chǎn)業(yè)園區(qū),來打造滬黔科技創(chuàng)新成果的轉(zhuǎn)化中心。”貴陽市市長馬寧宇說,貴安正在規(guī)劃建設(shè)全國規(guī)模最大,存算能力一流的高安全、高可靠、高可用的數(shù)據(jù)中心集群,為大數(shù)據(jù)、大算力、大模型的技術(shù)發(fā)展和應(yīng)用提供廣闊空間。
“東西合作有更多想象空間。”優(yōu)刻得科技股份有限公司副總裁劉杰認(rèn)為,“東數(shù)西算”工程可以解決算力問題,在GPU運(yùn)算中,西部成本比東部便宜一半。業(yè)內(nèi)其實(shí)也在探索“東數(shù)西訓(xùn)”,把非實(shí)時計(jì)算的AI訓(xùn)練過程放在西部進(jìn)行,涉及需要實(shí)時運(yùn)算的推理過程則在東部直接完成,更好地調(diào)度算力、節(jié)約成本。
設(shè)規(guī)則促進(jìn)“好模型”
既為創(chuàng)新“加油”,也為發(fā)展“立規(guī)”。專家認(rèn)為,目前大模型總體人才不足,不少應(yīng)用領(lǐng)域還未有成熟開發(fā),數(shù)據(jù)治理也有待提升,這既需要政府部門為創(chuàng)新的落地搭平臺、找場景,也需要為其安全探索設(shè)置好邊界。
今年4月,國家網(wǎng)信辦發(fā)布《生成式人工智能服務(wù)管理辦法(征求意見稿)》,對用于生成式人工智能產(chǎn)品的預(yù)訓(xùn)練、優(yōu)化訓(xùn)練數(shù)據(jù)提出明確要求。從治理原則到倫理規(guī)范,近年來我國一直加強(qiáng)對人工智能行業(yè)“立規(guī)”。
“大模型推動人工智能實(shí)現(xiàn)一次歷史性跨越,中國經(jīng)濟(jì)社會高質(zhì)量發(fā)展為大模型創(chuàng)新提供豐富場景和數(shù)據(jù)基礎(chǔ)。”中國科學(xué)技術(shù)信息研究所所長、科技部新一代人工智能發(fā)展研究中心主任趙志耘認(rèn)為,未來需要在四個方面著力:加強(qiáng)資源和研發(fā)力量統(tǒng)籌,促進(jìn)產(chǎn)學(xué)研合作與開源開放;加強(qiáng)大模型技術(shù)研發(fā),提升學(xué)術(shù)和開源影響力;強(qiáng)化大模型發(fā)展中的場景牽引作用,打造大模型標(biāo)桿項(xiàng)目;強(qiáng)化政策支持和配套服務(wù),加快推動大模型應(yīng)用落地。
從更深層次看,助力大模型走深走透,還需要更高質(zhì)量的數(shù)據(jù)庫。“未來對數(shù)據(jù)的高質(zhì)量和多維度要求都會更高。”中國人工智能開源軟件發(fā)展聯(lián)盟副理事長王健宗說,比如以前標(biāo)注一張圖,只需要說這是“一個公園”;但現(xiàn)在標(biāo)注就需要詳細(xì)描述為“母親和小孩在公園里散步”,標(biāo)注難度和工作數(shù)量級呈指數(shù)上升。
“數(shù)據(jù)變成必要的生產(chǎn)要素后,怎么安全合理地使用,是政府必須考慮的問題。以后對數(shù)據(jù)的質(zhì)量要求、使用門檻都會越來越高,需要規(guī)則的提前制定。”趙志耘說。
大算力:為大模型搭建“高速路”
以ChatGPT為代表的人工智能技術(shù)發(fā)展,引發(fā)了全球算力需求的進(jìn)一步增長。迎接新一輪人工智能熱潮,中國的算力增長點(diǎn)在哪里?什么樣的算力更精準(zhǔn)高效?記者日前采訪業(yè)內(nèi)專家,前瞻算力發(fā)展趨勢。
在全球新一輪人工智能技術(shù)發(fā)展浪潮中,大模型是一個關(guān)鍵詞。ChatGPT等正是通過大模型來“學(xué)習(xí)”海量數(shù)據(jù),并由此取得突破。
中國科學(xué)院院士陳潤生表示,人工智能大模型在應(yīng)用層面正在發(fā)生巨大變化,未來將在多個領(lǐng)域引發(fā)變革,同時也會消耗大量算力。
中國工程院院士鄭緯民說,做大模型必須要有“大算力”,ChatGPT正是基于大規(guī)模算力基礎(chǔ)設(shè)施的產(chǎn)物。
不久前舉行的中關(guān)村論壇上,科技部新一代人工智能發(fā)展研究中心發(fā)布了《中國人工智能大模型地圖研究報(bào)告》。報(bào)告顯示,我國研發(fā)的大模型數(shù)量排名全球第二。
中國科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心研究員陸忠華表示,全社會對算力的需求日益增長,人工智能應(yīng)用的算力需求更加突出,要迎接好這一趨勢。
近年來,我國人工智能算力的占比在升高。“根據(jù)估算,人工智能算力過去幾年大體上年均增長率為70%,其他算力大概增長30%左右。”中國信息通信研究院院長余曉暉說。
清華大學(xué)計(jì)算機(jī)系教授陳文光也觀察到,隨著人工智能的滲透程度加深,相比傳統(tǒng)超算中心,智算中心的利用率變得更高。
國家高性能計(jì)算機(jī)工程技術(shù)研究中心副主任曹振南則表示,雖然算力常被分為超算和人工智能計(jì)算,但二者有許多相像之處,最大區(qū)別在于對計(jì)算精度的要求不同。
“目前人工智能算力的缺口較大,一些人工智能應(yīng)用為追求計(jì)算性能而降低了精度要求。但如果算力變得易得、便宜,一些人工智能應(yīng)用可能又會對精度提出一些高要求。”曹振南說。
專家認(rèn)為,“通用算力+專用算力”將成為人工智能算力基礎(chǔ)設(shè)施的建設(shè)關(guān)鍵。一方面要滿足廣泛的應(yīng)用場景,具備普適性,實(shí)現(xiàn)通用;另一方面也能支持部分對計(jì)算精度、效率要求高的個性化應(yīng)用場景,具備高效性,實(shí)現(xiàn)專用。
在專家看來,將已有的、不同體系架構(gòu)的算力中心通過網(wǎng)絡(luò)連接起來,可以合理配置、共享、調(diào)度、釋放更多算力,并降低應(yīng)用門檻。
在科技部高新技術(shù)司的牽頭下,國家超算互聯(lián)網(wǎng)工作已經(jīng)啟動。按照規(guī)劃,到2025年底,國家超算互聯(lián)網(wǎng)將成為支撐數(shù)字中國建設(shè)的“高速路”。
曹振南介紹,超算互聯(lián)網(wǎng)平臺的建設(shè)目標(biāo)之一,正是致力于解決算力設(shè)施分布不均衡的問題,實(shí)現(xiàn)算力資源的互聯(lián)互通、資源共享。
中國科學(xué)院院士錢德沛表示,算力基礎(chǔ)設(shè)施提供的應(yīng)當(dāng)不僅是算力,更要有用戶所需的軟件或應(yīng)用服務(wù),這樣才能將算力資源最大化。
“希望超算算力未來能像電力一樣走進(jìn)千家萬戶,任何地方、任何時間都可以獲得大數(shù)據(jù)算力來支持相關(guān)應(yīng)用。”錢德沛說。(記者 吳蔚 周琳 楊有宗 潘德鑫 董瑞豐)