近10年來(lái),以深度學(xué)習(xí)為主要技術(shù)路線的人工智能(AI),從判別(如圖像、文字、語(yǔ)音識(shí)別等)到生成(如文本、圖像、視頻、程序等)接連取得突破,DeepSeek、ChatGPT、Sora等應(yīng)用展示多種技術(shù)可能。作為革命性通用技術(shù),人工智能正加速融入人們的日常生活、生產(chǎn)工作和學(xué)習(xí)研究之中,推動(dòng)人類經(jīng)濟(jì)社會(huì)信息化進(jìn)程邁向智能化的新階段。
發(fā)展新階段:從判別到生成,從單模態(tài)到多模態(tài),從專用到通用
人工智能作為近年來(lái)科技領(lǐng)域最熱門的話題之一,其實(shí)并不是一項(xiàng)新技術(shù)。早在1956年,人工智能的概念就在美國(guó)達(dá)特茅斯學(xué)院召開的夏季研討會(huì)上被提出。此后經(jīng)歷半個(gè)多世紀(jì)發(fā)展,都未能實(shí)現(xiàn)真正的實(shí)用化。2012年,加拿大多倫多大學(xué)教授杰弗里·欣頓和他的學(xué)生基于機(jī)器學(xué)習(xí)提出的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型,在圖像識(shí)別挑戰(zhàn)賽上取得重大突破,激發(fā)AI領(lǐng)域的又一次發(fā)展熱潮,推動(dòng)語(yǔ)音識(shí)別、圖像識(shí)別以及自然語(yǔ)言處理等多個(gè)領(lǐng)域快速進(jìn)步。
AI技術(shù)不斷迭代升級(jí)。特別是2022年前后,生成式人工智能迎來(lái)全面爆發(fā)。2022年11月,美國(guó)OpenAI公司推出ChatGPT,以更大規(guī)模的模型實(shí)現(xiàn)了更強(qiáng)的內(nèi)容生成(AIGC)功能。2024年2月,OpenAI公司推出的文生視頻大模型Sora,推動(dòng)生成式人工智能從只能理解單一形式信息(比如文字、圖片、音頻等)的單模態(tài),邁向可以同時(shí)理解多種形式信息(比如圖片和文字)的多模態(tài)。與此同時(shí),全球的AI大模型競(jìng)相超越又各有特長(zhǎng),國(guó)外谷歌的雙子座(Gemini)、安索皮克(Anthropic)的克勞德(Claude)、元公司(Meta)的Llama,中國(guó)的文心一言、智譜清言、豆包、書生·浦語(yǔ)、星火認(rèn)知、360智腦、通義千問(wèn)、混元、Kimi、零一萬(wàn)物等,形成百花競(jìng)放的局面。
2025年1月,我國(guó)人工智能企業(yè)深度求索(DeepSeek)推出新模型DeepSeek—R1,憑借技術(shù)創(chuàng)新和商業(yè)化潛力引發(fā)全球矚目。這不僅是因?yàn)樵撃P驮谧匀徽Z(yǔ)言處理方面表現(xiàn)卓越,更為重要的是其在訓(xùn)練方法上實(shí)現(xiàn)了創(chuàng)新,成功降低了同類產(chǎn)品對(duì)算力資源的大量需求,顯著降低了使用成本。得益于此,用戶可將R1部署在個(gè)人本地設(shè)備,實(shí)現(xiàn)更為安全且個(gè)性化的服務(wù)。尤為重要的是,DeepSeek的開源模式為全球創(chuàng)新發(fā)展帶來(lái)新機(jī)遇,并有可能帶動(dòng)全行業(yè)在未來(lái)形成以開源為主流的發(fā)展路線。
從判別到生成,從單模態(tài)到多模態(tài),從專用到通用,是智能化發(fā)展新階段的重要標(biāo)志。人工智能以自然語(yǔ)言為基礎(chǔ)的表達(dá)方式,正從方方面面滲透進(jìn)大眾生活。從手機(jī)應(yīng)用、智能音箱等智能助手,到智能網(wǎng)聯(lián)車和智能機(jī)器人等具身智能,再到能提供個(gè)性化服務(wù)的智能體以及更多的AI原生產(chǎn)品和服務(wù),正加速向我們走來(lái)。
核心驅(qū)動(dòng)力:計(jì)算機(jī)能夠從數(shù)據(jù)中學(xué)習(xí)規(guī)律并做出預(yù)測(cè)或決策
機(jī)器學(xué)習(xí)是指通過(guò)數(shù)據(jù)訓(xùn)練模型,使計(jì)算機(jī)能夠從數(shù)據(jù)中學(xué)習(xí)規(guī)律并做出預(yù)測(cè)或決策。作為當(dāng)下AI發(fā)展的主流技術(shù)路線,這條路線讓機(jī)器通過(guò)學(xué)習(xí)而不是靠預(yù)設(shè)規(guī)則來(lái)獲得智能,體現(xiàn)了學(xué)習(xí)是智能形成和發(fā)展的本質(zhì)?梢哉f(shuō),生物智能也好、機(jī)器智能也好,都離不開學(xué)習(xí),所有的成功和突破都源自學(xué)習(xí)。“生而知之”畢竟是極少數(shù)天才的特質(zhì),“學(xué)而知之”才適用于大多數(shù)人。人類在發(fā)展人工智能時(shí)也采用了學(xué)習(xí)的路線。
機(jī)器學(xué)習(xí)主要通過(guò)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)。神經(jīng)網(wǎng)絡(luò)作為機(jī)器學(xué)習(xí)的一種具體模型,就是通過(guò)模擬人腦的結(jié)構(gòu)和功能來(lái)處理數(shù)據(jù)。人類大腦是由神經(jīng)元和突觸構(gòu)成,神經(jīng)元通過(guò)突觸傳遞信號(hào),實(shí)現(xiàn)信息處理、學(xué)習(xí)和記憶等功能。人工神經(jīng)網(wǎng)絡(luò)模擬這一結(jié)構(gòu),利用集成電路芯片組成的電子計(jì)算系統(tǒng),采用人工神經(jīng)元和連接(即模型參數(shù))代替生物神經(jīng)元和突觸,通過(guò)輸入數(shù)據(jù)、調(diào)整權(quán)重來(lái)學(xué)習(xí)和預(yù)測(cè),構(gòu)成了AI的物質(zhì)底座。
正如人腦層數(shù)越多,處理復(fù)雜信息的能力就越強(qiáng),神經(jīng)網(wǎng)絡(luò)也同樣需要更多的層數(shù),這就需要借助深度神經(jīng)網(wǎng)絡(luò)。以深度神經(jīng)網(wǎng)絡(luò)構(gòu)建的深度學(xué)習(xí)系統(tǒng)即為AI“模型”,這類模型的參數(shù)越多,就意味著模型越大,性能越強(qiáng)。例如,GPT—3模型實(shí)現(xiàn)了千億量級(jí)參數(shù),GPT—4模型參數(shù)甚至達(dá)萬(wàn)億量級(jí)。
簡(jiǎn)而言之,機(jī)器學(xué)習(xí)是人工智能的核心驅(qū)動(dòng)力,它通過(guò)從海量數(shù)據(jù)中提取有價(jià)值的信息,幫助人類做出預(yù)測(cè)、判斷和生成所需的內(nèi)容,從而提升任務(wù)處理效率,將人力從繁重、重復(fù)、低級(jí)和危險(xiǎn)的勞動(dòng)中解放出來(lái)。2024年的諾貝爾物理學(xué)獎(jiǎng)?lì)C給了約翰·霍普菲爾德和杰弗里·欣頓,以表彰他們通過(guò)人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)機(jī)器學(xué)習(xí)的基礎(chǔ)性發(fā)現(xiàn)和發(fā)明。展望未來(lái),機(jī)器學(xué)習(xí)通過(guò)不斷發(fā)展,必將為人類社會(huì)帶來(lái)更大驚喜。
更廣泛運(yùn)用:AI智能體可望成為今年發(fā)展應(yīng)用亮點(diǎn)
2025年將是AI走向更廣和更深應(yīng)用的關(guān)鍵之年,AI智能體(或稱AI代理)可望成為今年AI發(fā)展應(yīng)用的亮點(diǎn)。AI智能體可以說(shuō)是人工智能技術(shù)的集大成者,具備自主性、感知能力、決策能力和行動(dòng)能力等顯著優(yōu)勢(shì)。它能夠通過(guò)理解交辦的任務(wù)、感知相應(yīng)的執(zhí)行環(huán)境,進(jìn)而自主調(diào)用相應(yīng)的智能模型功能、采取相應(yīng)的行動(dòng),可以廣泛應(yīng)用于工業(yè)、醫(yī)療、交通、金融和家庭等領(lǐng)域。每個(gè)用戶可能有多個(gè)AI智能體幫助解決各種需求,它們有的像是秘書,有的像是工匠,有的像是醫(yī)護(hù),有的像是采購(gòu)員,有的像是清潔工。
例如,某公司計(jì)劃設(shè)計(jì)一個(gè)活動(dòng)邀請(qǐng)系統(tǒng),在將活動(dòng)時(shí)間、地點(diǎn)和主題等信息準(zhǔn)確傳達(dá)后,AI可自動(dòng)生成一個(gè)智能體“小組長(zhǎng)”,負(fù)責(zé)整體規(guī)劃和調(diào)度。小組長(zhǎng)可以召喚多個(gè)執(zhí)行不同具體任務(wù)的智能體,1號(hào)智能體負(fù)責(zé)活動(dòng)邀請(qǐng)函的策劃,2號(hào)智能體負(fù)責(zé)設(shè)計(jì)邀請(qǐng)函中的圖像及文字,3號(hào)智能體負(fù)責(zé)代碼制作和部署網(wǎng)頁(yè),4號(hào)智能體負(fù)責(zé)檢驗(yàn)差錯(cuò),他們就像是一個(gè)“工作專班”,成為完成個(gè)性化工作的“群體智能”。
通過(guò)AI智能體,各種AI技術(shù)將會(huì)被更方便、更廣泛、更有效地應(yīng)用起來(lái),將在多個(gè)領(lǐng)域引發(fā)根本性變革。同時(shí),快速發(fā)展的“科研智能”正在形成科學(xué)發(fā)展的新范式,為科技這一第一生產(chǎn)力的發(fā)展賦能,意義深刻而長(zhǎng)遠(yuǎn)。在這個(gè)日新月異的智能時(shí)代,學(xué)會(huì)應(yīng)用AI技術(shù)也將成為多數(shù)人的必備技能,人們需要學(xué)會(huì)以有效而適當(dāng)?shù)姆绞竭\(yùn)用AI助益工作和生活。
“兩岸猿聲啼不住,輕舟已過(guò)萬(wàn)重山。”隨著AI在生命科學(xué)、物質(zhì)科學(xué)、數(shù)學(xué)、工程技術(shù)等領(lǐng)域的應(yīng)用日益廣泛和深入,可以預(yù)見(jiàn),正如歷史上機(jī)械動(dòng)力和電氣技術(shù)極大拓展了人類的體力勞動(dòng)能力一樣,AI正在加速拓展人類的腦力勞動(dòng)能力,推動(dòng)生產(chǎn)力實(shí)現(xiàn)又一次質(zhì)的飛躍,并對(duì)人類社會(huì)的發(fā)展進(jìn)步產(chǎn)生全面而深遠(yuǎn)的影響。
在AI先進(jìn)生產(chǎn)力驅(qū)動(dòng)的社會(huì)智能化歷史進(jìn)程面前,人類要把握和主導(dǎo)自身的命運(yùn),就必須提升自身的智能化能力,學(xué)會(huì)駕馭AI。各方應(yīng)努力讓AI行駛在促進(jìn)經(jīng)濟(jì)繁榮和環(huán)境保護(hù)、保護(hù)公共利益和個(gè)人隱私、遵守法律法規(guī)和倫理良俗、促進(jìn)公平正義與包容和諧的軌道上,確保AI造福全人類的可持續(xù)發(fā)展。
(作者為中國(guó)新一代人工智能發(fā)展戰(zhàn)略研究院執(zhí)行院長(zhǎng))