競速大模型:一手創(chuàng)新策源,一手落地應用
新華社上海6月9日電 題:競速大模型:一手創(chuàng)新策源,一手落地應用
新華社記者周琳、楊有宗、潘德鑫
百花齊放、競相涌現(xiàn),2023年至今,大模型帶火的通用人工智能賽道,出現(xiàn)了眾多玩家。科技部新一代人工智能發(fā)展研究中心等機構發(fā)布的數(shù)據顯示,中國10億參數(shù)規(guī)模以上的大模型已發(fā)布79個。這一席卷科技界的AI革命,將如何改變世界?大模型又將如何一手促進創(chuàng)新策源,一手服務實體經濟?在從業(yè)者看來,這場競速賽才剛剛開始。
大模型探索大應用
在位于上海臨港新片區(qū)的商湯科技智算中心一樓展示大廳,可以和大模型“商量”,用中文“商量”一下。
記者在現(xiàn)場感受發(fā)現(xiàn),作為千億級參數(shù)的自然語言處理模型“商量”,它不僅可以進行多輪對話、人機共創(chuàng)童話故事,還可以自動生成簡單代碼、進行“文生圖”等。例如,在輸入了20張“港風”照片后,生成式AI就可以自動生成一張類似風格的“氛圍感”圖片。
“無論是讓大模型寫出一首質量過關的古詩,還是根據描述生成圖像,都要求其對中文語言的理解足夠深刻。這需要經過多輪對話的訓練,包括輔助語料的投喂,才能逐漸讓模型理解漢語的規(guī)律。”商湯科技首席科學家王曉剛說。
語言類大模型不是唯一形態(tài),多種通用大模型正在持續(xù)拓展應用場景?萍疾啃乱淮斯ぶ悄馨l(fā)展研究中心等機構發(fā)布的《中國人工智能大模型地圖研究報告》顯示,中國研發(fā)的大模型數(shù)量排名全球第二,僅次于美國。
一方面大模型從辦公、生活、娛樂向醫(yī)療、教育、設計等行業(yè)加速滲透;另一方面,一些垂直專業(yè)類大模型不斷深化落地,生物制藥、遙感、氣象等大模型正在發(fā)揮縱深優(yōu)勢。
4月初,上海人工智能實驗室聯(lián)合中國科學技術大學、上海交通大學、南京信息工程大學、中國科學院大氣物理研究所及上海中心氣象臺發(fā)布全球中期天氣預報大模型“風烏”,30秒生成未來10天全球氣象高精度預報結果。
在氣象氣候預報任務中,全球中期天氣預報是重要預測任務之一,它以預測未來14天內的大氣系統(tǒng)狀態(tài)為目標。“風烏”在預報精度上降低了誤差,在時效上突破了10天,而且僅需單GPU(圖形處理器)便可運行。
上海人工智能實驗室領軍科學家歐陽萬里說:“‘風烏’取名自秦漢時期的‘相風銅烏’,是世界上最早的測風設備。天氣預報大模型‘風烏’承載中國古人的智慧,也寓意實驗室致力于在以氣象為代表的人工智能服務科學領域不懈探索。”
大算力搭建新“底座”
出臺支持舉措、整合創(chuàng)新資源、布局新興賽道……近段時間以來,各地都在為人工智能的創(chuàng)新策源“鋪路”。
5月30日,北京發(fā)布《北京市加快建設具有全球影響力的人工智能創(chuàng)新策源地實施方案(2023—2025年)》《北京市促進通用人工智能創(chuàng)新發(fā)展的若干措施》等方案;深圳發(fā)布關于加快推動人工智能高質量發(fā)展高水平應用行動方案;上海市經信委表示,超大規(guī)模預訓練模型是人工智能從專業(yè)智能走向通用智能的關鍵技術,未來將加快研究打造大模型生態(tài)集聚和創(chuàng)新應用高地,推進算力資源統(tǒng)一調度。
算力是研發(fā)大模型必不可少的基礎設施,已成為不少城市爭相布局的焦點。“近期生成式人工智能等應用大爆發(fā),推動了算力需求激增。很多企業(yè)在落戶前都會問,算力需求能否被滿足,這已是一種稀缺資源。”上海臨港新片區(qū)管委會高科處處長陸瑜說,這也是臨港發(fā)力構建更為完善的算力產業(yè)生態(tài)、搭建公共平臺的初衷。
瞄準產業(yè)痛點,智能算力更需要一體化調度、經濟化使用。專家認為,“東數(shù)西算”工程的全面實施,將一手促進東部數(shù)字經濟產業(yè)鏈向西部延伸拓展,一手讓算力資源精準配置和按需獲取,有效降低能源消耗。
“我們將在貴安新區(qū)共同合作建設新的產業(yè)園區(qū),來打造滬黔科技創(chuàng)新成果的轉化中心。”貴陽市市長馬寧宇說,貴安正在規(guī)劃建設全國規(guī)模最大,存算能力一流的高安全、高可靠、高可用的數(shù)據中心集群,為大數(shù)據、大算力、大模型的技術發(fā)展和應用提供廣闊空間。
“東西合作有更多想象空間。”優(yōu)刻得科技股份有限公司副總裁劉杰認為,“東數(shù)西算”工程可以解決算力問題,在GPU運算中,西部成本比東部便宜一半。業(yè)內其實也在探索“東數(shù)西訓”,把非實時計算的AI訓練過程放在西部進行,涉及需要實時運算的推理過程則在東部直接完成,更好地調度算力、節(jié)約成本。
設規(guī)則促進“好模型”
既為創(chuàng)新“加油”,也為發(fā)展“立規(guī)”。專家認為,目前大模型總體人才不足,不少應用領域還未有成熟開發(fā),數(shù)據治理也有待提升,這既需要政府部門為創(chuàng)新的落地搭平臺、找場景,也需要為其安全探索設置好邊界。
今年4月,國家網信辦發(fā)布《生成式人工智能服務管理辦法(征求意見稿)》,對用于生成式人工智能產品的預訓練、優(yōu)化訓練數(shù)據提出明確要求。從治理原則到倫理規(guī)范,近年來我國一直加強對人工智能行業(yè)“立規(guī)”。
“大模型推動人工智能實現(xiàn)一次歷史性跨越,中國經濟社會高質量發(fā)展為大模型創(chuàng)新提供豐富場景和數(shù)據基礎。”中國科學技術信息研究所所長、科技部新一代人工智能發(fā)展研究中心主任趙志耘認為,未來需要在四個方面著力:加強資源和研發(fā)力量統(tǒng)籌,促進產學研合作與開源開放;加強大模型技術研發(fā),提升學術和開源影響力;強化大模型發(fā)展中的場景牽引作用,打造大模型標桿項目;強化政策支持和配套服務,加快推動大模型應用落地。
從更深層次看,助力大模型走深走透,還需要更高質量的數(shù)據庫。“未來對數(shù)據的高質量和多維度要求都會更高。”中國人工智能開源軟件發(fā)展聯(lián)盟副理事長王健宗說,比如以前標注一張圖,只需要說這是“一個公園”;但現(xiàn)在標注就需要詳細描述為“母親和小孩在公園里散步”,標注難度和工作數(shù)量級呈指數(shù)上升。
“數(shù)據變成必要的生產要素后,怎么安全合理地使用,是政府必須考慮的問題。以后對數(shù)據的質量要求、使用門檻都會越來越高,需要規(guī)則的提前制定。”趙志耘說。
新華社上海6月9日電 題:競速大模型:一手創(chuàng)新策源,一手落地應用
新華社記者周琳、楊有宗、潘德鑫
百花齊放、競相涌現(xiàn),2023年至今,大模型帶火的通用人工智能賽道,出現(xiàn)了眾多玩家。科技部新一代人工智能發(fā)展研究中心等機構發(fā)布的數(shù)據顯示,中國10億參數(shù)規(guī)模以上的大模型已發(fā)布79個。這一席卷科技界的AI革命,將如何改變世界?大模型又將如何一手促進創(chuàng)新策源,一手服務實體經濟?在從業(yè)者看來,這場競速賽才剛剛開始。
大模型探索大應用
在位于上海臨港新片區(qū)的商湯科技智算中心一樓展示大廳,可以和大模型“商量”,用中文“商量”一下。
記者在現(xiàn)場感受發(fā)現(xiàn),作為千億級參數(shù)的自然語言處理模型“商量”,它不僅可以進行多輪對話、人機共創(chuàng)童話故事,還可以自動生成簡單代碼、進行“文生圖”等。例如,在輸入了20張“港風”照片后,生成式AI就可以自動生成一張類似風格的“氛圍感”圖片。
“無論是讓大模型寫出一首質量過關的古詩,還是根據描述生成圖像,都要求其對中文語言的理解足夠深刻。這需要經過多輪對話的訓練,包括輔助語料的投喂,才能逐漸讓模型理解漢語的規(guī)律。”商湯科技首席科學家王曉剛說。
語言類大模型不是唯一形態(tài),多種通用大模型正在持續(xù)拓展應用場景?萍疾啃乱淮斯ぶ悄馨l(fā)展研究中心等機構發(fā)布的《中國人工智能大模型地圖研究報告》顯示,中國研發(fā)的大模型數(shù)量排名全球第二,僅次于美國。
一方面大模型從辦公、生活、娛樂向醫(yī)療、教育、設計等行業(yè)加速滲透;另一方面,一些垂直專業(yè)類大模型不斷深化落地,生物制藥、遙感、氣象等大模型正在發(fā)揮縱深優(yōu)勢。
4月初,上海人工智能實驗室聯(lián)合中國科學技術大學、上海交通大學、南京信息工程大學、中國科學院大氣物理研究所及上海中心氣象臺發(fā)布全球中期天氣預報大模型“風烏”,30秒生成未來10天全球氣象高精度預報結果。
在氣象氣候預報任務中,全球中期天氣預報是重要預測任務之一,它以預測未來14天內的大氣系統(tǒng)狀態(tài)為目標。“風烏”在預報精度上降低了誤差,在時效上突破了10天,而且僅需單GPU(圖形處理器)便可運行。
上海人工智能實驗室領軍科學家歐陽萬里說:“‘風烏’取名自秦漢時期的‘相風銅烏’,是世界上最早的測風設備。天氣預報大模型‘風烏’承載中國古人的智慧,也寓意實驗室致力于在以氣象為代表的人工智能服務科學領域不懈探索。”
大算力搭建新“底座”
出臺支持舉措、整合創(chuàng)新資源、布局新興賽道……近段時間以來,各地都在為人工智能的創(chuàng)新策源“鋪路”。
5月30日,北京發(fā)布《北京市加快建設具有全球影響力的人工智能創(chuàng)新策源地實施方案(2023—2025年)》《北京市促進通用人工智能創(chuàng)新發(fā)展的若干措施》等方案;深圳發(fā)布關于加快推動人工智能高質量發(fā)展高水平應用行動方案;上海市經信委表示,超大規(guī)模預訓練模型是人工智能從專業(yè)智能走向通用智能的關鍵技術,未來將加快研究打造大模型生態(tài)集聚和創(chuàng)新應用高地,推進算力資源統(tǒng)一調度。
算力是研發(fā)大模型必不可少的基礎設施,已成為不少城市爭相布局的焦點。“近期生成式人工智能等應用大爆發(fā),推動了算力需求激增。很多企業(yè)在落戶前都會問,算力需求能否被滿足,這已是一種稀缺資源。”上海臨港新片區(qū)管委會高科處處長陸瑜說,這也是臨港發(fā)力構建更為完善的算力產業(yè)生態(tài)、搭建公共平臺的初衷。
瞄準產業(yè)痛點,智能算力更需要一體化調度、經濟化使用。專家認為,“東數(shù)西算”工程的全面實施,將一手促進東部數(shù)字經濟產業(yè)鏈向西部延伸拓展,一手讓算力資源精準配置和按需獲取,有效降低能源消耗。
“我們將在貴安新區(qū)共同合作建設新的產業(yè)園區(qū),來打造滬黔科技創(chuàng)新成果的轉化中心。”貴陽市市長馬寧宇說,貴安正在規(guī)劃建設全國規(guī)模最大,存算能力一流的高安全、高可靠、高可用的數(shù)據中心集群,為大數(shù)據、大算力、大模型的技術發(fā)展和應用提供廣闊空間。
“東西合作有更多想象空間。”優(yōu)刻得科技股份有限公司副總裁劉杰認為,“東數(shù)西算”工程可以解決算力問題,在GPU運算中,西部成本比東部便宜一半。業(yè)內其實也在探索“東數(shù)西訓”,把非實時計算的AI訓練過程放在西部進行,涉及需要實時運算的推理過程則在東部直接完成,更好地調度算力、節(jié)約成本。
設規(guī)則促進“好模型”
既為創(chuàng)新“加油”,也為發(fā)展“立規(guī)”。專家認為,目前大模型總體人才不足,不少應用領域還未有成熟開發(fā),數(shù)據治理也有待提升,這既需要政府部門為創(chuàng)新的落地搭平臺、找場景,也需要為其安全探索設置好邊界。
今年4月,國家網信辦發(fā)布《生成式人工智能服務管理辦法(征求意見稿)》,對用于生成式人工智能產品的預訓練、優(yōu)化訓練數(shù)據提出明確要求。從治理原則到倫理規(guī)范,近年來我國一直加強對人工智能行業(yè)“立規(guī)”。
“大模型推動人工智能實現(xiàn)一次歷史性跨越,中國經濟社會高質量發(fā)展為大模型創(chuàng)新提供豐富場景和數(shù)據基礎。”中國科學技術信息研究所所長、科技部新一代人工智能發(fā)展研究中心主任趙志耘認為,未來需要在四個方面著力:加強資源和研發(fā)力量統(tǒng)籌,促進產學研合作與開源開放;加強大模型技術研發(fā),提升學術和開源影響力;強化大模型發(fā)展中的場景牽引作用,打造大模型標桿項目;強化政策支持和配套服務,加快推動大模型應用落地。
從更深層次看,助力大模型走深走透,還需要更高質量的數(shù)據庫。“未來對數(shù)據的高質量和多維度要求都會更高。”中國人工智能開源軟件發(fā)展聯(lián)盟副理事長王健宗說,比如以前標注一張圖,只需要說這是“一個公園”;但現(xiàn)在標注就需要詳細描述為“母親和小孩在公園里散步”,標注難度和工作數(shù)量級呈指數(shù)上升。
“數(shù)據變成必要的生產要素后,怎么安全合理地使用,是政府必須考慮的問題。以后對數(shù)據的質量要求、使用門檻都會越來越高,需要規(guī)則的提前制定。”趙志耘說。