首頁(yè)|必讀|視頻|專訪|運(yùn)營(yíng)|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|低空經(jīng)濟(jì)|智能汽車|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片|報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁(yè) >> 頭條資訊 >> 正文

Epoch AI 預(yù)言:最快 1 年內(nèi),推理模型步伐將放緩

2025年5月14日 09:26  IT之家  作 者:故淵

非營(yíng)利 AI 研究機(jī)構(gòu) Epoch AI 最新發(fā)布報(bào)告,指出 AI 企業(yè)難以從推理模型中,持續(xù)榨取巨大性能收益,最快在一年內(nèi),推理模型的進(jìn)步將放緩。

報(bào)告基于公開數(shù)據(jù)和假設(shè),強(qiáng)調(diào)了計(jì)算資源的限制和研究開銷的增加。AI 行業(yè)長(zhǎng)期依賴這些模型來提升基準(zhǔn)表現(xiàn),但這種依賴性正面臨挑戰(zhàn)。

該機(jī)構(gòu)分析師 Josh You 指出推理模型的興起,源于其在特定任務(wù)上的出色表現(xiàn)。例如,OpenAI 的 o3 模型在最近幾個(gè)月里,主要提升數(shù)學(xué)和編程技能。

而這些推理模型通過增加計(jì)算資源來解決問題,從而提升性能,不過作為代價(jià),這些推理模型需要更多計(jì)算來處理復(fù)雜任務(wù),因此比傳統(tǒng)模型耗時(shí)更長(zhǎng)。

IT之家注:推理模型的訓(xùn)練過程先是基于海量數(shù)據(jù)訓(xùn)練一個(gè)常規(guī)模型,然后應(yīng)用強(qiáng)化學(xué)習(xí)技術(shù)。該技術(shù)像給模型提供“反饋”一樣,幫助它優(yōu)化對(duì)難題的解決方案。這種方法推動(dòng)了 AI 的快速迭代,但也暴露了潛在的瓶頸。

OpenAI 等前沿 AI 實(shí)驗(yàn)室正加大對(duì)強(qiáng)化學(xué)習(xí)的投資。公司表示,在訓(xùn)練 o3 時(shí),使用了約 10 倍于前代 o1 的計(jì)算資源,大部分用于強(qiáng)化學(xué)習(xí)階段。研究者 Dan Roberts 透露,OpenAI 的未來計(jì)劃將優(yōu)先強(qiáng)化學(xué)習(xí),并投入更多計(jì)算力,甚至超過初始模型訓(xùn)練的水平。

這種策略加速了模型的改進(jìn),但 Epoch 的分析提醒,這種改進(jìn)并非沒有上限,計(jì)算資源的增加會(huì)遇到物理和經(jīng)濟(jì)約束。

Josh You 在分析中詳細(xì)解釋了性能增長(zhǎng)的差異。標(biāo)準(zhǔn) AI 模型訓(xùn)練的性能目前每年翻番,而強(qiáng)化學(xué)習(xí)的性能每 3-5 個(gè)月增長(zhǎng)十倍。這種快速增長(zhǎng)可能到 2026 年與整體 AI 前沿進(jìn)展趨同。

他強(qiáng)調(diào),推理模型的規(guī);媾R不止計(jì)算問題,還包括高研究開銷:“如果研究需要持續(xù)的高開銷,推理模型可能無法達(dá)到預(yù)期規(guī)模”。

編 輯:路金娣
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
推薦新聞              
 
人物
韋樂平詳解生成式人工智能的聯(lián)網(wǎng)技術(shù)
精彩視頻
聯(lián)想天禧個(gè)人超級(jí)智能體,有何“超級(jí)”之處?
北京聯(lián)通雙萬(wàn)兆AI賦能行動(dòng)正式發(fā)布
專家談 | 中國(guó)信通院曹薊光:大模型紅利加速釋放AI跨行業(yè)全場(chǎng)景賦能
飛象趣談第二十五期!全球人形機(jī)器人半馬首秀,中國(guó)黑科技如何讓機(jī)器人跑贏未來!
精彩專題
第八屆數(shù)字中國(guó)建設(shè)峰會(huì)
通信產(chǎn)業(yè)2024年業(yè)績(jī)盤點(diǎn)
3·15權(quán)益日 | 共筑滿意消費(fèi) 守護(hù)信息通信安全防線
聚焦2025全國(guó)兩會(huì)
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱: 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像