99久久99久久精品免费看蜜桃,99精品久久久中文字幕,亚洲欧美另类久久久精品能播放的

OpenAI進(jìn)入新品發(fā)布周期開(kāi)源模型GPT-OSS打頭陣

原創(chuàng)

2025-08-06 02:49 星期三

財(cái)聯(lián)社史正丞

①這是2019年GPT-2后，OpenAI時(shí)隔6年首度推出開(kāi)源模型；
②模型能力處于開(kāi)源模型第一梯隊(duì)，但距離尖端封閉模型仍有差距；
③奧爾特曼同時(shí)強(qiáng)調(diào)本周晚些時(shí)候會(huì)有一項(xiàng)“重大更新”。

財(cái)聯(lián)社8月6日訊（編輯史正丞）OpenAI首席執(zhí)行官山姆·奧爾特曼周二宣布，公司將在未來(lái)幾天里帶來(lái)許多新東西，其中周二會(huì)迎來(lái)一項(xiàng)“小而重磅”的更新——預(yù)熱已久的開(kāi)源模型GPT-OSS。

簡(jiǎn)單而言，OpenAI周二共發(fā)布兩款開(kāi)放權(quán)重AI推理模型。其中參數(shù)量達(dá)到1170億的gpt-oss-120b能力更強(qiáng)，可以由單個(gè)英偉達(dá)專業(yè)數(shù)據(jù)中心GPU驅(qū)動(dòng)；參數(shù)量210億的gpt-oss-20b模型，則能夠在配備16GB內(nèi)存的消費(fèi)級(jí)筆記本電腦上運(yùn)行。

雖然公司名字叫OpenAI，但這已經(jīng)是2019年的GPT-2后，這家AI初創(chuàng)公司時(shí)隔6年首度推出開(kāi)源模型。在今年1月DeepSeek引爆開(kāi)源AI風(fēng)暴后，奧爾特曼曾認(rèn)錯(cuò)稱OpenAI在開(kāi)源技術(shù)方面“站在了歷史的錯(cuò)誤一邊”，這正是OpenAI重新推出開(kāi)源模型的原因。

兩款模型都以寬松的Apache 2.0許可證發(fā)布，企業(yè)在商用前無(wú)需付費(fèi)或獲得許可。

就模型性能而言，GPT-OSS大致位于開(kāi)源模型的第一梯隊(duì)，但整體略遜于自家的GPT-o3和o4-mini。

例如在Codeforces（帶工具）的編程測(cè)試中，gpt-oss-120b和gpt-oss-20b的“跑分”分別為2622和2516分，雖然高于一些頭部開(kāi)源模型，但依然比不過(guò)頭部閉源推理模型。

類似的情況也發(fā)生在“人類最后的考試”測(cè)試中，兩款開(kāi)源模型的得分分別為19%和17.3%，同樣比不過(guò)o3。

與閉源模型類似，兩款開(kāi)放模型都采用了混合專家（MoE）技術(shù)，處理問(wèn)題時(shí)只會(huì)激活較少的參數(shù)。對(duì)于1170億參數(shù)量的gpt-oss-120b，處理每一個(gè)token時(shí)僅激活51億個(gè)參數(shù)。

值得注意的是，相較o3和o4-mini模型，兩款開(kāi)放模型也會(huì)出現(xiàn)更多的幻覺(jué)。OpenAI解釋稱，由于較小的模型擁有的世界知識(shí)比大型前沿模型少，所以更容易產(chǎn)生幻覺(jué)也在意料之中。在OpenAI內(nèi)部用于衡量模型對(duì)人物知識(shí)準(zhǔn)確性的PersonQA基準(zhǔn)測(cè)試中，gpt-oss-120b和gpt-oss-20b分別對(duì)49%和53%的問(wèn)題產(chǎn)生幻覺(jué)，達(dá)到o1模型的3倍多，也高于o4-mini模型的36%。

順便一提，作為毫無(wú)驚喜的預(yù)告，奧爾特曼同時(shí)強(qiáng)調(diào)本周晚些時(shí)候會(huì)有一項(xiàng)“重大更新”。鑒于公司這段日子不斷吊業(yè)界胃口的舉動(dòng)，市場(chǎng)普遍預(yù)期OpenAI下一個(gè)重磅更新將是推出GPT-5。

閱95.29W

我要評(píng)論

反饋意見(jiàn)