超高清欧美videossexopor,狠狠综合久久久久综合网站

DeepSeek新版本，針對下一代國產(chǎn)芯片做了優(yōu)化

2025-08-21 15:03 星期四

財聯(lián)社

①DeepSeek-V3.1正式發(fā)布，包含混合推理架構(gòu)、更高思考效率和更強Agent能力等主要變化；
②新模型在工具使用與智能體任務(wù)中表現(xiàn)提升，用戶可通過“深度思考”按鈕切換思考模式與非思考模式。

財聯(lián)社8月21日訊，據(jù)DeepSeek官方公眾號消息，DeepSeek-V3.1正式發(fā)布。DeepSeek在其官宣發(fā)布DeepSeek-V3.1的文章中提到，DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數(shù)精度。

另外，V3.1對分詞器及chat template進行了較大調(diào)整，與DeepSeek-V3存在明顯差異。

DeepSeek官微在置頂留言里表示，UE8M0 FP8是針對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計。

本次升級包含以下主要變化：混合推理架構(gòu)：一個模型同時支持思考模式與非思考模式；更高的思考效率：相比DeepSeek-R1-0528，DeepSeek-V3.1-Think能在更短時間內(nèi)給出答案；更強的Agent能力：通過Post-Training優(yōu)化，新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升。官方App與網(wǎng)頁端模型已同步升級為DeepSeek-V3.1。用戶可以通過“深度思考”按鈕，實現(xiàn)思考模式與非思考模式的自由切換。

以下為原文：

DeepSeek-V3.1發(fā)布，邁向Agent時代的第一步

今天，我們正式發(fā)布DeepSeek-V3.1。本次升級包含以下主要變化：

混合推理架構(gòu)：一個模型同時支持思考模式與非思考模式；

更高的思考效率：相比DeepSeek-R1-0528，DeepSeek-V3.1-Think能在更短時間內(nèi)給出答案；

更強的 Agent 能力：通過Post-Training優(yōu)化，新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升。

官方 App 與網(wǎng)頁端模型已同步升級為DeepSeek-V3.1。用戶可以通過“深度思考”按鈕，實現(xiàn)思考模式與非思考模式的自由切換。

DeepSeek API也已同步升級，deepseek-chat對應(yīng)非思考模式，deepseek-reasoner對應(yīng)思考模式，且上下文均已擴展為 128K。同時，API Beta接口支持了strict模式的Function Calling，以確保輸出的Function滿足schema定義。（詳見官方文檔：https://api-docs.deepseek.com/zh-cn/guides/function_calling）

另外，我們增加了對 Anthropic API格式的支持，讓大家可以輕松將DeepSeek-V3.1的能力接入Claude Code框架。（詳見官方文檔：https://api-docs.deepseek.com/zh-cn/guides/anthropic_api）

工具調(diào)用/智能體支持增強

編程智能體

表 1：編程智能體測評（SWE 使用內(nèi)部框架測評，相比開源框架OpenHands所需輪數(shù)更少；Terminal Bench使用官方 Terminus 1 framework）

在代碼修復測評 SWE 與命令行終端環(huán)境下的復雜任務(wù)（Terminal-Bench）測試中，DeepSeek-V3.1 相比之前的 DeepSeek 系列模型有明顯提高。

搜索智能體

表 2：搜索智能體測評（測試結(jié)果調(diào)用商用搜索引擎 API+網(wǎng)頁過濾+128K context window；R1-0528 使用內(nèi)部 workflow 模式測試；HLE 測試同時使用python與search工具）

DeepSeek-V3.1 在多項搜索評測指標上取得了較大提升。在需要多步推理的復雜搜索測試（browsecomp）與多學科專家級難題測試（HLE）上，DeepSeek-V3.1性能已大幅領(lǐng)先R1-0528。

思考效率提升

我們的測試結(jié)果顯示，經(jīng)過思維鏈壓縮訓練后，V3.1-Think在輸出token數(shù)減少20%-50%的情況下，各項任務(wù)的平均表現(xiàn)與R1-0528持平。

在各項評測指標得分基本持平的情況下（AIME 2015: 87.5/88.4， GPQA: 81/80.1， liveCodeBench: 73.3/74.8），R1-0528 與 V3.1-Think 的token消耗量對比圖

同時，V3.1在非思考模式下的輸出長度也得到了有效控制，相比于DeepSeek-V3-0324 ，能夠在輸出長度明顯減少的情況下保持相同的模型性能。

API & 模型開源

模型開源

V3.1的Base模型在V3的基礎(chǔ)上重新做了外擴訓練，一共增加訓練了840B tokens。Base模型與后訓練模型均已在Huggingface與魔搭開源。

Base 模型：

Hugging Face:

https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

魔搭：

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base

后訓練模型：

Hugging Face:

https://huggingface.co/deepseek-ai/DeepSeek-V3.1

魔搭：

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1

需要注意的是，DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數(shù)精度。另外，V3.1對分詞器及chat template進行了較大調(diào)整，與DeepSeek-V3存在明顯差異。建議有部署需求的用戶仔細閱讀新版說明文檔。

價格調(diào)整

我們將于北京時間2025年9月6日凌晨起，對DeepSeek開放平臺API接口調(diào)用價格進行如下調(diào)整：

執(zhí)行新版價格表（如下圖所示，詳見定價頁面）；

取消夜間時段優(yōu)惠。

在9月6日前，所有API服務(wù)仍按原價格政策計費，您可繼續(xù)享受當前優(yōu)惠。

閱89.97W

我要評論

反饋意見

圖片

歡迎您發(fā)表有價值的評論，發(fā)布廣告和不和諧的評論都將會被刪除，您的賬號將禁止評論。

發(fā)表評論

要聞

股市

關(guān)聯(lián)話題

人工智能

5.55W 人關(guān)注

AIGC

1.03W 人關(guān)注

99精品国产成人一区二区,少妇做爰xxxⅹ高潮喷水,女性裸体啪啪喷水无遮挡,国产精品综合色区小说,天天躁日日躁狠狠躁婷婷

首頁

電報

話題

盯盤

VIP

FM

投研

下載

頭條

A股

港股

環(huán)球

公司

券商

基金·ETF

地產(chǎn)

金融

汽車

科創(chuàng)

品見

表 1：編程智能體測評（SWE 使用內(nèi)部框架測評，相比開源框架OpenHands所需輪數(shù)更少；Terminal Bench使用官方 Terminus 1 framework）

表 2：搜索智能體測評（測試結(jié)果調(diào)用商用搜索引擎 API+網(wǎng)頁過濾+128K context window；R1-0528 使用內(nèi)部 workflow 模式測試；HLE 測試同時使用python與search工具）

在各項評測指標得分基本持平的情況下（AIME 2015: 87.5/88.4， GPQA: 81/80.1， liveCodeBench: 73.3/74.8），R1-0528 與 V3.1-Think 的token消耗量對比圖

首頁

電報

話題

盯盤

VIP

FM

投研

下載

表 1：編程智能體測評（SWE 使用內(nèi)部框架測評，相比開源框架OpenHands所需輪數(shù)更少；Terminal Bench使用官方 Terminus 1 framework）

表 2：搜索智能體測評（測試結(jié)果調(diào)用商用搜索引擎 API+網(wǎng)頁過濾+128K context window；R1-0528 使用內(nèi)部 workflow 模式測試；HLE 測試同時使用python與search工具）

在各項評測指標得分基本持平的情況下（AIME 2015: 87.5/88.4， GPQA: 81/80.1， liveCodeBench: 73.3/74.8），R1-0528 與 V3.1-Think 的token消耗量對比圖

表 1：編程智能體測評（SWE 使用內(nèi)部框架測評，相比開源框架OpenHands所需輪數(shù)更少；Terminal Bench使用官方 Terminus 1 framework）

表 2：搜索智能體測評（測試結(jié)果調(diào)用商用搜索引擎 API+網(wǎng)頁過濾+128K context window；R1-0528 使用內(nèi)部 workflow 模式測試；HLE 測試同時使用python與search工具）

在各項評測指標得分基本持平的情況下（AIME 2015: 87.5/88.4， GPQA: 81/80.1， liveCodeBench: 73.3/74.8），R1-0528 與 V3.1-Think 的token消耗量對比圖