99精品国产成人一区二区,少妇做爰xxxⅹ高潮喷水,女性裸体啪啪喷水无遮挡,国产精品综合色区小说,天天躁日日躁狠狠躁婷婷

OpenAI進(jìn)入新品發(fā)布周期 開(kāi)源模型GPT-OSS打頭陣
原創(chuàng)
2025-08-06 02:49 星期三
財(cái)聯(lián)社 史正丞
①這是2019年GPT-2后,OpenAI時(shí)隔6年首度推出開(kāi)源模型;
②模型能力處于開(kāi)源模型第一梯隊(duì),但距離尖端封閉模型仍有差距;
③奧爾特曼同時(shí)強(qiáng)調(diào)本周晚些時(shí)候會(huì)有一項(xiàng)“重大更新”。

財(cái)聯(lián)社8月6日訊(編輯 史正丞)OpenAI首席執(zhí)行官山姆·奧爾特曼周二宣布,公司將在未來(lái)幾天里帶來(lái)許多新東西,其中周二會(huì)迎來(lái)一項(xiàng)“小而重磅”的更新——預(yù)熱已久的開(kāi)源模型GPT-OSS。

image

簡(jiǎn)單而言,OpenAI周二共發(fā)布兩款開(kāi)放權(quán)重AI推理模型。其中參數(shù)量達(dá)到1170億的gpt-oss-120b能力更強(qiáng),可以由單個(gè)英偉達(dá)專業(yè)數(shù)據(jù)中心GPU驅(qū)動(dòng);參數(shù)量210億的gpt-oss-20b模型,則能夠在配備16GB內(nèi)存的消費(fèi)級(jí)筆記本電腦上運(yùn)行。

image

雖然公司名字叫OpenAI,但這已經(jīng)是2019年的GPT-2后,這家AI初創(chuàng)公司時(shí)隔6年首度推出開(kāi)源模型。在今年1月DeepSeek引爆開(kāi)源AI風(fēng)暴后,奧爾特曼曾認(rèn)錯(cuò)稱OpenAI在開(kāi)源技術(shù)方面“站在了歷史的錯(cuò)誤一邊”,這正是OpenAI重新推出開(kāi)源模型的原因。

兩款模型都以寬松的Apache 2.0許可證發(fā)布,企業(yè)在商用前無(wú)需付費(fèi)或獲得許可。

就模型性能而言,GPT-OSS大致位于開(kāi)源模型的第一梯隊(duì),但整體略遜于自家的GPT-o3和o4-mini。

例如在Codeforces(帶工具)的編程測(cè)試中,gpt-oss-120b和gpt-oss-20b的“跑分”分別為2622和2516分,雖然高于一些頭部開(kāi)源模型,但依然比不過(guò)頭部閉源推理模型。

image

類似的情況也發(fā)生在“人類最后的考試”測(cè)試中,兩款開(kāi)源模型的得分分別為19%和17.3%,同樣比不過(guò)o3。

image

與閉源模型類似,兩款開(kāi)放模型都采用了混合專家(MoE)技術(shù),處理問(wèn)題時(shí)只會(huì)激活較少的參數(shù)。對(duì)于1170億參數(shù)量的gpt-oss-120b,處理每一個(gè)token時(shí)僅激活51億個(gè)參數(shù)。

值得注意的是,相較o3和o4-mini模型,兩款開(kāi)放模型也會(huì)出現(xiàn)更多的幻覺(jué)。OpenAI解釋稱,由于較小的模型擁有的世界知識(shí)比大型前沿模型少,所以更容易產(chǎn)生幻覺(jué)也在意料之中。在OpenAI內(nèi)部用于衡量模型對(duì)人物知識(shí)準(zhǔn)確性的PersonQA基準(zhǔn)測(cè)試中,gpt-oss-120b和gpt-oss-20b分別對(duì)49%和53%的問(wèn)題產(chǎn)生幻覺(jué),達(dá)到o1模型的3倍多,也高于o4-mini模型的36%。

順便一提,作為毫無(wú)驚喜的預(yù)告,奧爾特曼同時(shí)強(qiáng)調(diào)本周晚些時(shí)候會(huì)有一項(xiàng)“重大更新”。鑒于公司這段日子不斷吊業(yè)界胃口的舉動(dòng),市場(chǎng)普遍預(yù)期OpenAI下一個(gè)重磅更新將是推出GPT-5。

收藏
95.29W
我要評(píng)論
圖片
歡迎您發(fā)表有價(jià)值的評(píng)論,發(fā)布廣告和不和諧的評(píng)論都將會(huì)被刪除,您的賬號(hào)將禁止評(píng)論。
發(fā)表評(píng)論
要聞
股市
關(guān)聯(lián)話題
5.55W 人關(guān)注
2.21W 人關(guān)注