財(cái)聯(lián)社3月24日電,近日,螞蟻集團(tuán)Ling團(tuán)隊(duì)發(fā)表了一篇技術(shù)成果論文。論文顯示,螞蟻集團(tuán)推出了兩款不同規(guī)模的MoE大語(yǔ)言模型——百靈輕量版(Ling-Lite)與百靈增強(qiáng)版(Ling-Plus),前者參數(shù)規(guī)模為168億(激活參數(shù)27.5億),Plus基座模型參數(shù)規(guī)模高達(dá)2900億(激活參數(shù)288億),兩者性能均達(dá)到行業(yè)領(lǐng)先水平。除了自研性能領(lǐng)先的大模型以外,該技術(shù)論文最大的突破在于提出了一系列創(chuàng)新方法,以提升資源受限環(huán)境下AI開(kāi)發(fā)的效率與可及性。實(shí)驗(yàn)表明,其3000億參數(shù)的MoE(混合專(zhuān)家)大模型可在使用國(guó)產(chǎn)GPU的低性能設(shè)備上完成高效訓(xùn)練,性能與完全使用英偉達(dá)芯片、同規(guī)模的稠密模型及MoE模型相當(dāng)。