參考消息網(wǎng)12月22日報(bào)道 據(jù)彭博新聞社網(wǎng)站12月21日報(bào)道,美國開放人工智能研究中心(OpenAI)正準(zhǔn)備推出一款新的人工智能(AI)模型,該模型據(jù)稱與其當(dāng)前產(chǎn)品相比,具有更先進(jìn)、近似人類的推理能力。這令OpenAI與谷歌等業(yè)內(nèi)對手之間的競爭愈發(fā)激烈。
這款名為o3的新模型在20日一場直播活動(dòng)中亮相。在解決更復(fù)雜的多步驟問題時(shí),這款模型在回應(yīng)之前會(huì)花更多時(shí)間計(jì)算答案。OpenAI還將推出一個(gè)輕量級(jí)版本,名為o3-mini。
在直播中,OpenAI分享了一些初步細(xì)節(jié),顯示o3在回答與編碼等主題相關(guān)的復(fù)雜問題時(shí)表現(xiàn)勝過o1。o1是OpenAI在9月推出的推理模型。作為新軟件發(fā)布前的環(huán)節(jié)之一,OpenAI還要求安全和保障研究人員申請測試這些模型。其首席執(zhí)行官薩姆·奧爾特曼在直播中說,他們計(jì)劃在明年1月底推出o3-mini,之后不久就推出了o3。
OpenAI在兩年前發(fā)布了聊天生成預(yù)訓(xùn)練轉(zhuǎn)換器(ChatGPT),一場AI軍備競賽由此拉開大幕。這款聊天機(jī)器人最初是由大型語言模型GPT-3.5驅(qū)動(dòng),隨后在2023年,OpenAI推出據(jù)稱更準(zhǔn)確、更具創(chuàng)造性的GPT-4。不久前它又推出首個(gè)推理模型o1。OpenAI的發(fā)言人表示,他們在給這款新模型命名時(shí)決定跳過o2,這是“出于對英國電信公司O2的尊重”。
其他頂級(jí)AI開發(fā)商也在利用越來越先進(jìn)的技術(shù)進(jìn)行產(chǎn)品迭代。本月早些時(shí)候,谷歌推出了其旗艦?zāi)P?ldquo;雙子座”(Gemini)的新版本,據(jù)稱速度是上一代的兩倍,并且可以“思考、記憶、規(guī)劃,甚至代表你采取行動(dòng)”。元宇宙平臺(tái)公司首席執(zhí)行官馬克·扎克伯格最近也透露了明年推出Llama 4的計(jì)劃。
然而,彭博新聞社此前報(bào)道稱,包括OpenAI和谷歌在內(nèi),幾家領(lǐng)先者正面臨新模型開發(fā)耗資巨大但回報(bào)遞減的問題。這在一定程度上是由于難以找到足夠多新的、未曾接入的高質(zhì)量人工訓(xùn)練數(shù)據(jù)來源。為了解決這個(gè)問題,這些公司正在轉(zhuǎn)向新策略,包括更加強(qiáng)調(diào)所謂的推理。
在發(fā)布新模型預(yù)覽的同時(shí),OpenAI還發(fā)布一項(xiàng)研究,介紹了它采用的一種新方法,可以確保像o1和o3這樣的系統(tǒng)分辨哪些該做哪些不該做,例如避免幫用戶從事非法活動(dòng)。這種技術(shù)被稱為“慎重對齊”,它要求模型在思考回應(yīng)用戶查詢時(shí),遵循一系列與安全相關(guān)的步驟。
這個(gè)問題有時(shí)被稱為“對齊”,對于那些構(gòu)建大型語言模型的公司而言是一個(gè)技術(shù)挑戰(zhàn),畢竟這些模型通常需要基于大量互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行訓(xùn)練。由于人們的道德和價(jià)值觀不同,對AI該做什么和不該做什么的看法也各異,“對齊”是一項(xiàng)復(fù)雜的任務(wù)。
OpenAI的最新聲明為它為期12天的產(chǎn)品直播活動(dòng)畫上句號(hào)。這家初創(chuàng)公司利用這一系列發(fā)布活動(dòng)推出價(jià)格更高的ChatGPT Pro新訂閱選項(xiàng),并開始推出AI視頻生成工具“天空”(Sora)等新產(chǎn)品。(編譯/朱麗)