99精品国产成人一区二区,少妇做爰xxxⅹ高潮喷水,女性裸体啪啪喷水无遮挡,国产精品综合色区小说,天天躁日日躁狠狠躁婷婷

DeepSeek新版本,針對下一代國產(chǎn)芯片做了優(yōu)化
2025-08-21 15:03 星期四
財聯(lián)社
①DeepSeek-V3.1正式發(fā)布,包含混合推理架構(gòu)、更高思考效率和更強Agent能力等主要變化;
②新模型在工具使用與智能體任務(wù)中表現(xiàn)提升,用戶可通過“深度思考”按鈕切換思考模式與非思考模式。

財聯(lián)社8月21日訊,據(jù)DeepSeek官方公眾號消息,DeepSeek-V3.1正式發(fā)布。DeepSeek在其官宣發(fā)布DeepSeek-V3.1的文章中提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數(shù)精度。

另外,V3.1對分詞器及chat template進行了較大調(diào)整,與DeepSeek-V3存在明顯差異。

DeepSeek官微在置頂留言里表示,UE8M0 FP8是針對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計。

image

本次升級包含以下主要變化:混合推理架構(gòu):一個模型同時支持思考模式與非思考模式;更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短時間內(nèi)給出答案;更強的Agent能力:通過Post-Training優(yōu)化,新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升。官方App與網(wǎng)頁端模型已同步升級為DeepSeek-V3.1。用戶可以通過“深度思考”按鈕,實現(xiàn)思考模式與非思考模式的自由切換。

以下為原文:

DeepSeek-V3.1發(fā)布,邁向Agent時代的第一步

今天,我們正式發(fā)布DeepSeek-V3.1。本次升級包含以下主要變化:

混合推理架構(gòu):一個模型同時支持思考模式與非思考模式;

更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短時間內(nèi)給出答案;

更強的 Agent 能力:通過Post-Training優(yōu)化,新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升。

官方 App 與網(wǎng)頁端模型已同步升級為DeepSeek-V3.1。用戶可以通過“深度思考”按鈕,實現(xiàn)思考模式與非思考模式的自由切換。

DeepSeek API也已同步升級,deepseek-chat對應(yīng)非思考模式,deepseek-reasoner對應(yīng)思考模式,且上下文均已擴展為 128K。同時,API Beta接口支持了strict模式的Function Calling,以確保輸出的Function滿足schema定義。(詳見官方文檔:https://api-docs.deepseek.com/zh-cn/guides/function_calling)

另外,我們增加了對 Anthropic API格式的支持,讓大家可以輕松將DeepSeek-V3.1的能力接入Claude Code框架。(詳見官方文檔:https://api-docs.deepseek.com/zh-cn/guides/anthropic_api)

工具調(diào)用/智能體支持增強

編程智能體

image

表 1:編程智能體測評(SWE 使用內(nèi)部框架測評,相比開源框架OpenHands所需輪數(shù)更少;Terminal Bench使用官方 Terminus 1 framework)

在代碼修復測評 SWE 與命令行終端環(huán)境下的復雜任務(wù)(Terminal-Bench)測試中,DeepSeek-V3.1 相比之前的 DeepSeek 系列模型有明顯提高。

搜索智能體

image

表 2:搜索智能體測評(測試結(jié)果調(diào)用商用搜索引擎 API+網(wǎng)頁過濾+128K context window;R1-0528 使用內(nèi)部 workflow 模式測試;HLE 測試同時使用python與search工具)

DeepSeek-V3.1 在多項搜索評測指標上取得了較大提升。在需要多步推理的復雜搜索測試(browsecomp)與多學科專家級難題測試(HLE)上,DeepSeek-V3.1性能已大幅領(lǐng)先R1-0528。

思考效率提升

我們的測試結(jié)果顯示,經(jīng)過思維鏈壓縮訓練后,V3.1-Think在輸出token數(shù)減少20%-50%的情況下,各項任務(wù)的平均表現(xiàn)與R1-0528持平。

image

在各項評測指標得分基本持平的情況下(AIME 2015: 87.5/88.4, GPQA: 81/80.1, liveCodeBench: 73.3/74.8),R1-0528 與 V3.1-Think 的token消耗量對比圖

同時,V3.1在非思考模式下的輸出長度也得到了有效控制,相比于DeepSeek-V3-0324 ,能夠在輸出長度明顯減少的情況下保持相同的模型性能。

API & 模型開源

模型開源

V3.1的Base模型在V3的基礎(chǔ)上重新做了外擴訓練,一共增加訓練了840B tokens。Base模型與后訓練模型均已在Huggingface與魔搭開源。

Base 模型:

Hugging Face:

https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

魔搭:

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base

后訓練模型:

Hugging Face:

https://huggingface.co/deepseek-ai/DeepSeek-V3.1

魔搭:

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1

需要注意的是,DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數(shù)精度。另外,V3.1對分詞器及chat template進行了較大調(diào)整,與DeepSeek-V3存在明顯差異。建議有部署需求的用戶仔細閱讀新版說明文檔。

價格調(diào)整

我們將于北京時間2025年9月6日凌晨起,對DeepSeek開放平臺API接口調(diào)用價格進行如下調(diào)整:

執(zhí)行新版價格表(如下圖所示,詳見定價頁面);

取消夜間時段優(yōu)惠。

image

在9月6日前,所有API服務(wù)仍按原價格政策計費,您可繼續(xù)享受當前優(yōu)惠。

收藏
89.97W
我要評論
圖片
歡迎您發(fā)表有價值的評論,發(fā)布廣告和不和諧的評論都將會被刪除,您的賬號將禁止評論。
發(fā)表評論
要聞
股市
關(guān)聯(lián)話題
5.55W 人關(guān)注
1.03W 人關(guān)注