電報(bào)解讀
2025.08.28 22:25 星期四
//電報(bào)內(nèi)容
【字節(jié)跳動(dòng)推出視頻生成模型OmniHuman-1.5】《科創(chuàng)板日?qǐng)?bào)》28日訊,字節(jié)跳動(dòng)近日推出視頻生成模型OmniHuman-1.5。據(jù)介紹,該模型架構(gòu)將多模態(tài)大語(yǔ)言模型與擴(kuò)散Transformer相結(jié)合,模擬兩種不同的思維模式:緩慢深思的規(guī)劃與迅捷直覺(jué)的反應(yīng)。這種強(qiáng)效協(xié)同可生成時(shí)長(zhǎng)超一分鐘的動(dòng)態(tài)視頻 ,包含流暢的鏡頭運(yùn)動(dòng)、復(fù)雜的多角色互動(dòng)及高度動(dòng)態(tài)的動(dòng)作表現(xiàn)。
//解讀摘要
字節(jié)跳動(dòng)推出視頻生成模型!當(dāng)前行業(yè)進(jìn)入商業(yè)化發(fā)展快軌,視頻生成模型已具備提供收入的能力,這家公司發(fā)布全球首個(gè)集成視頻大模型與3D大模型的AI平臺(tái),另一家AIGC視頻內(nèi)容智能生成系統(tǒng)融合了大模型技術(shù)。