在全球AI競賽邁入深水區(qū)的當(dāng)下,真正的競爭已不再是單點(diǎn)技術(shù)的突破,而是生態(tài)與架構(gòu)的定義權(quán)之爭。生態(tài)碎片化、算力成本高企、技術(shù)代差隱現(xiàn)——這些瓶頸,正倒逼中國AI產(chǎn)業(yè)尋找新的解法。
當(dāng)大模型飛速迭代、算力需求成倍攀升,高端算力是否只能走封閉優(yōu)化的老路?什么樣的基礎(chǔ)設(shè)施和生態(tài)才能支撐可持續(xù)創(chuàng)新?
在9月5日開幕的2025世界智能產(chǎn)業(yè)博覽會上,中科曙光攜手二十余家產(chǎn)業(yè)鏈企業(yè),給出了答案——國內(nèi)首個“AI計算開放架構(gòu)”正式發(fā)布,AI超集群系統(tǒng)同步亮相,多項(xiàng)關(guān)鍵技術(shù)能力開放,并啟動“AI計算開放架構(gòu)聯(lián)合實(shí)驗(yàn)室。這一系列動作,并非單一產(chǎn)品的迭代,而是一次面向生態(tài)重構(gòu)的積極信號。
中科曙光高級副總裁李斌表示,過去十年,中科曙光建設(shè)了20多個大規(guī)模算力集群,累計部署超50萬張異構(gòu)加速卡,有能力、也有責(zé)任來推動AI計算領(lǐng)域的開放協(xié)作與生態(tài)構(gòu)建。
正如計算機(jī)產(chǎn)業(yè)的演進(jìn)路徑 —— 從早期 “類大型機(jī)” 的封閉垂直系統(tǒng)與 “類 Cluster” 的集群開源系統(tǒng)并行,到小型機(jī)逐步向 X86 服務(wù)器、云計算迭代;又如移動互聯(lián)網(wǎng)時代 iOS 與安卓的生態(tài)分野 ——AI 時代同樣亟需多元、開放且具備進(jìn)化能力的架構(gòu)與生態(tài)體系。畢竟,封閉體系或許能在短期內(nèi)實(shí)現(xiàn)效率優(yōu)勢,但長遠(yuǎn)來看,開放與協(xié)同才是通往下一代智能計算的核心密鑰。
AI超集群系統(tǒng)實(shí)現(xiàn)性能躍升,開放架構(gòu)推動算力普惠
本次智博會上發(fā)布的國內(nèi)首個AI計算開放架構(gòu),正是“算力開放”理念的承載——其面向大規(guī)模智能計算場景,以GPU為核心,圍繞“算、存、網(wǎng)、電、冷、管、軟”七大維度,構(gòu)建緊耦合系統(tǒng)設(shè)計,旨在實(shí)現(xiàn)從單點(diǎn)技術(shù)突破到集群協(xié)同創(chuàng)新的跨越,具備多元算力、高速互連、存算協(xié)同、綠色高效、穩(wěn)定可靠、生態(tài)繁榮等主要特征。
作為該架構(gòu)的落地成果,曙光AI超集群系統(tǒng)也在智博會上正式亮相。據(jù)介紹,該系統(tǒng)擁有“超高性能、超高效率、超高可靠、全面開放”四大特征,單機(jī)柜支持96張加速卡、提供百P級算力,并可擴(kuò)展至百萬卡超大規(guī)模集群。
在性能層面,系統(tǒng)通過存算傳協(xié)同設(shè)計、“超級隧道”AI存儲優(yōu)化、先進(jìn)冷板液冷技術(shù)、軟硬協(xié)同調(diào)度與智能調(diào)度大模型等創(chuàng)新,實(shí)現(xiàn)系統(tǒng)性能效率大幅提升,實(shí)測千卡集群大模型訓(xùn)推性能達(dá)到業(yè)界主流水平2.3倍,模型開發(fā)效率提升高達(dá)4倍,GPU算效增加55%,平均無故障時間(MTBF)提高2.1倍,平均故障修復(fù)時間(MTTR)降低47%。
值得注意的是,與專有傳統(tǒng)封閉系統(tǒng)不同,曙光AI超集群支持多品牌GPU加速卡,兼容包括CUDA在內(nèi)的主流軟件生態(tài),為用戶帶來更多硬件選型自由和更低的開發(fā)遷移成本。
五大層面打破“重復(fù)造輪子”,走向生態(tài)協(xié)同
不久前DeepSeek在發(fā)布V3.1更新時的一句“UE8M0 FP8是針對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計”,不僅點(diǎn)燃了A股投資者對國產(chǎn)算力板塊的熱情,更反映出了國產(chǎn)AI軟硬件生態(tài)正進(jìn)一步走向協(xié)同融合的大趨勢。
但相比算力開放,生態(tài)協(xié)同更為復(fù)雜。開放生態(tài)要求從芯片設(shè)計之初便開展深度融合與協(xié)同規(guī)劃,并將協(xié)作貫穿整個生命周期。因此,需要由具備全面技術(shù)實(shí)力的領(lǐng)軍企業(yè)牽頭,建立并推動協(xié)同機(jī)制運(yùn)轉(zhuǎn)。
在這次智博會上,中科曙光沿著產(chǎn)業(yè)鏈進(jìn)一步推進(jìn)橫向協(xié)同合作。其聯(lián)合芯片、整機(jī)等多家企業(yè)宣布開放一批關(guān)鍵技術(shù)能力。首批公開的三項(xiàng)技術(shù)能力包括AI存儲優(yōu)化、液冷基礎(chǔ)設(shè)施設(shè)計規(guī)范、DeepAI基礎(chǔ)軟件棧,覆蓋部件、系統(tǒng)、基礎(chǔ)設(shè)施、軟件及數(shù)據(jù)集五大層面,旨在降低中小企業(yè)的研發(fā)門檻,避免“重復(fù)造輪子”。
同時,中科曙光還攜手20多家智算上下游企業(yè),依托國家先進(jìn)計算產(chǎn)業(yè)中心共同啟動建設(shè)“AI計算開放架構(gòu)聯(lián)合實(shí)驗(yàn)室”,以推進(jìn)產(chǎn)業(yè)鏈開放跨層協(xié)作優(yōu)化。
縱觀整場發(fā)布,不難看出中科曙光與其生態(tài)伙伴的清晰路徑:從技術(shù)單點(diǎn)突破走向系統(tǒng)集群創(chuàng)新,從企業(yè)單打獨(dú)斗走向產(chǎn)業(yè)協(xié)同共創(chuàng)。這背后的目標(biāo)不僅是推出高性能產(chǎn)品,更在于構(gòu)建一個真正開放、普惠、安全可控的國產(chǎn)智算生態(tài)體系。在這次智博會上,以中科曙光為代表的國產(chǎn)算力產(chǎn)業(yè)鏈玩家推動的改變,或許有望成為中國智能計算從“可用”走向“好用”、邁入“安卓時刻”的重要里程碑。