電報(bào)解讀
2025.06.17 17:36 星期二
//電報(bào)內(nèi)容
【MiniMax發(fā)布推理模型對(duì)標(biāo)DeepSeek 算力成本僅約53萬(wàn)美元】財(cái)聯(lián)社6月17日電,MiniMax6月17日宣布將連續(xù)五天發(fā)布重要更新。今天第一彈是開(kāi)源首個(gè)推理模型MiniMax-M1。根據(jù)官方的報(bào)告,MiniMax-M1多項(xiàng)基準(zhǔn)測(cè)試比肩DeepSeek-R1、Qwen3等開(kāi)源模型,接近海外的最領(lǐng)先模型。官方博客還提到,基于兩大技術(shù)創(chuàng)新,MiniMax-M1訓(xùn)練過(guò)程高效得“超出預(yù)期”,只用了3周時(shí)間、512塊H800 GPU就完成強(qiáng)化學(xué)習(xí)訓(xùn)練階段,算力租賃成本僅53.47萬(wàn)美元。這比一開(kāi)始的預(yù)期少了一個(gè)數(shù)量級(jí)。
//解讀摘要
支持上下文長(zhǎng)度達(dá)DeepSeek R1八倍!MiniMax發(fā)布首個(gè)推理模型M1,機(jī)構(gòu)稱(chēng)本地推理需求的增加將促進(jìn)ASIC市場(chǎng)需求擴(kuò)容,這家公司的設(shè)備可應(yīng)用于ASIC的電子裝聯(lián)和封裝環(huán)節(jié),另一家掌握的技術(shù)可將光芯片或光模塊與ASIC控制芯片封裝在一起。