①在剛剛落下帷幕的2025世界機器人大會,英偉達攜手眾多中國機器人生態(tài)合作伙伴亮相,展示了其在物理AI與通用機器人領(lǐng)域的戰(zhàn)略布局。 ②英偉達的機器人生態(tài)并非簡單采購關(guān)系,而是以基礎(chǔ)設(shè)施,把分散的硬件本體、垂直場景、算法團隊編織成一張可快速商業(yè)落地的網(wǎng)絡(luò)。
《科創(chuàng)板日報》8月13日訊(記者 李明明)黃仁勛正在像押注OpenAI一樣在中國押注未來的具身智能巨頭。
在剛剛落下帷幕的2025世界機器人大會,英偉達攜手眾多中國機器人生態(tài)合作伙伴亮相,展示了其在物理AI與通用機器人領(lǐng)域的戰(zhàn)略布局,宇樹科技和銀河通用位列其中。
這兩家企業(yè)近期常被業(yè)內(nèi)以“南宇樹 北銀河”的說法同時提起,分別代表著硬件本體和軟件大腦的兩條核心技術(shù)路徑。在這場大會上,英偉達Omniverse與仿真模擬技術(shù)副總裁 Rev Lebaredian、宇樹科技創(chuàng)始人王興興與銀河通用機器人創(chuàng)始人及CTO、智源學(xué)者王鶴罕見同框,三人圍繞人形機器人領(lǐng)域的諸多熱點話題展開了討論。
南宇樹 北銀河
就像當年英偉達押注OpenAI一樣,黃仁勛正在重注中國未來的具身智能巨頭,但不同的是,黃仁勛這次把籌碼分散下注在了多家中國機器人公司身上。
本次大會,眾多英偉達的機器人生態(tài)合作伙伴亮相,除了上述銀河通用和宇樹科技,中堅科技、傅利葉智能、北京人形機器人創(chuàng)新中心、加速進化、星動紀元、逐際動力、優(yōu)必選、樂聚機器人、星海圖、眾擎機器人等也悉數(shù)現(xiàn)身。
此前,英偉達在CES 2025一次性展示的 14 款人形機器人中,也有 6 款來自中國;在北京 2025WRC 現(xiàn)場,又把這些中國伙伴放到舞臺 C 位,無疑再次凸顯了英偉達利用中國供應(yīng)鏈、場景與數(shù)據(jù)紅利的策略 。
可以看到,英偉達的機器人生態(tài)并非簡單采購關(guān)系,而是以“算力-仿真-數(shù)據(jù)”三環(huán)相扣的基礎(chǔ)設(shè)施,把分散的硬件本體、垂直場景、算法團隊編織成一張可快速商業(yè)落地的網(wǎng)絡(luò)。
從英偉達的布局來看,涵蓋了具身智能、機器人、多場景應(yīng)用等多個關(guān)鍵領(lǐng)域。在技術(shù)層面,借助合作伙伴在硬件研發(fā)和軟件算法的創(chuàng)新,結(jié)合自身的AI技術(shù)、仿真技術(shù)以及機器人超級計算機,構(gòu)建從模型訓(xùn)練、仿真測試到終端部署的全棧機器人技術(shù)體系;
在市場應(yīng)用方面,英偉達通過與不同特點的企業(yè)合作,覆蓋工業(yè)制造、商業(yè)零售、物流、城市服務(wù)、教育、娛樂等多元場景,加速機器人在各行業(yè)的滲透和普及。
其中,銀河通用自研的、內(nèi)置英偉達Thor芯片的人形機器人Galbot,就在本次WRC大會上引起了關(guān)注。記者在大會現(xiàn)場的搬運任務(wù)展示環(huán)節(jié)看到,Galbot可快速滑步至貨架,自主完成裝卸動作,全程無需人工干預(yù)。
宇樹則為其新型人形機器人R1部署了NVIDIA全棧機器人技術(shù)。
英偉達把專注不同環(huán)節(jié)的兩家標桿性企業(yè)同時放進生態(tài),或有對沖風險和加速收斂之意。
100萬億美元物理世界市場
本次三人對談內(nèi)容涵蓋其大規(guī)模商用過程中的難點、面臨的關(guān)鍵挑戰(zhàn)、存在的技術(shù)瓶頸與發(fā)展風向,人形及雙足設(shè)計的必要性,中國企業(yè)在物理AI與機器人領(lǐng)域的優(yōu)勢,以及預(yù)計將率先實現(xiàn)普及的應(yīng)用場景等方面。
Rev Lebaredian率先拋出了主要論斷:過去計算主要影響信息世界,而現(xiàn)在借助人工智能,計算能通過機器人進入物理世界,連接信息與物理世界,挖掘100萬億美元物理世界市場的潛力。
中國在AI人才(全球近半)、電子制造能力、制造業(yè)基礎(chǔ)(提供機器人部署測試場景)上具有獨特優(yōu)勢,是物理AI和機器人發(fā)展的理想之地。
在英偉達的機器人相關(guān)布局上,Rev Lebaredian表示,需打造機器人本體計算機(如Jetson Thor)、AI工廠計算機(如DGX系統(tǒng))、仿真計算機三類計算機,分別用于機器人內(nèi)部運行、開發(fā)“大腦”、生成數(shù)據(jù)和測試。
對人口與機器人關(guān)系的看法上,他認為,機器人數(shù)量與生育率無直接關(guān)聯(lián),但機器人可作為“人工人口”提升生產(chǎn)力,應(yīng)對人口縮減帶來的經(jīng)濟問題。
王興興將人形機器人視為通用機器人的重要載體,結(jié)構(gòu)相對簡單(由關(guān)節(jié)電機串聯(lián)而成),未來有望像組裝電腦一樣普及,且通用AI成熟后對硬件要求會降低。
對于宇樹的產(chǎn)品進展,王興興披露,此前發(fā)布的人形機器人售價9.9萬元,新版本降至3.9萬元,具備競爭力,外觀可定制,現(xiàn)貨供應(yīng)且年底量產(chǎn)。
技術(shù)與應(yīng)用上,利用NVIDIA的Isaac Sim平臺訓(xùn)練機器人動作,但受硬件物理極限限制,復(fù)雜動作執(zhí)行受限;
自主開發(fā)20自由度靈巧手,目標是讓機器人執(zhí)行日常任務(wù);通過采集人體動作數(shù)據(jù)結(jié)合深度強化學(xué)習訓(xùn)練動作;
目前,機器人已在晚會表演、商業(yè)演出、機器人格斗賽等場景應(yīng)用。
王鶴則表示,銀河通用的目標是打造通用機器人,其核心要素包括本體、具身智能模型、數(shù)據(jù)支撐。
未來與商業(yè)化方面,銀河通用商業(yè)化落地案例包括全球首個24小時智慧藥房解決方案(簽約超100家藥店)、24小時智慧零售店項目(已在部分城市落地)。
他表示,未來十年人形機器人產(chǎn)值增長迅速,市場規(guī)模有望超越當前工業(yè)機器人。限制人形機器人規(guī)?;渴鸬年P(guān)鍵是干活能力不足、任務(wù)類型有限,解決目標識別和定位問題后,市場規(guī)??捎^。
以下是精選后的三人媒體問答內(nèi)容:
人形機器人商業(yè)化與技術(shù)瓶頸
1、 宇樹R1定價3.99萬元,這是否意味著硬件成本已不再是影響機器人商業(yè)化的障礙?現(xiàn)階段,推動人形機器人規(guī)?;逃眠€存在哪些難點?
王興興:我一直認為,人形機器人商業(yè)化的關(guān)鍵不在成本和硬件。畢竟哪怕一臺機器要10萬、100萬,只要能用,很多場景照樣能落地。
現(xiàn)在最棘手的問題是具身智能模型的泛用性和實用性還不夠。其實硬件在過去一兩年就已經(jīng)夠用了,后續(xù)無非是在可靠性、成本上再優(yōu)化,但它并非限制因素。
2、未來機器人在哪些場景會迎來大規(guī)模普及?
王興興:未來機器人會更實用,但發(fā)展周期較長,像新能源車一樣,成熟需要時間?,F(xiàn)在的機器人技術(shù)才發(fā)展兩三年,和十幾二十年前的技術(shù)水平完全不同,不能混為一談,整體還需時間培育。不過行業(yè)成長迅速,未來幾年人員和出貨量有望每年翻倍。
若有更通用的AI大模型,機器人在工廠、家庭等更多場景的表現(xiàn)會更好,也更容易普及。整體來看,普及周期會更長,尤其是家用領(lǐng)域,難點不在技術(shù),而在倫理、安全等要求高,導(dǎo)致普及門檻高。
3、今年,許多人形機器人已開始在汽車工廠進行訓(xùn)練。機器人真正能在工廠車間投入工作還需要多長時間?還有哪些關(guān)鍵挑戰(zhàn)需要解決?
王鶴:今年,不少人形機器人已開始在汽車工廠接受訓(xùn)練。目前多數(shù)公司在工廠推廣這類機器人,主要聚焦搬運和分揀兩大方向。
搬運方面,銀河通用近期展示的機器人視頻顯示,其搬運速度已接近人類,每小時搬運量與人類相當,現(xiàn)已非常接近實際工廠部署水平,預(yù)計今年年底可能有幾十臺投入車間實際應(yīng)用。
但搬運只是開端,還需實現(xiàn)碼垛的閉環(huán)能力。只有搬運和碼垛均形成閉環(huán),機器人才算真正勝任整套工作流程,否則任務(wù)只完成一半,效果會打折扣。
分揀則是更大的挑戰(zhàn)。無論是從傳送帶取物還是從貨架取貨,當前最大的難題是速度。熟練工人取物速度很快,而機器人目前在模型和硬件層面,還難以達到這樣的效率。
我們研發(fā)的零售機器人,從貨架或桌面取物的技術(shù)本質(zhì)與工業(yè)分揀類似,只是零售對節(jié)奏要求較低,拿錯貨的后果也較輕。但在工業(yè)場景,比如汽車制造廠,生產(chǎn)線停機一分鐘就可能造成上萬元損失,因此對分揀的精度和速度要求極高。
總的來說,分揀技術(shù)雖已有不小進步,但目前尚未達到人類工人的水平,仍需一定時間進行技術(shù)迭代和突破。
4、目前限制人形機器人規(guī)?;渴鸬年P(guān)鍵技術(shù)瓶頸是什么?
王鶴:最核心的問題很簡單:機器人干活能力還不夠強,能做的任務(wù)類型有限。但如果能把這些有限技能做到足夠通用,就能快速賦能很多場景。
銀河通用目前最主要的突破在“抓取”和“移動”上。只要機器人能抓住任何物體,能在場景中完成下肢移動、上肢伸展,最后準確放置物體,這三個能力具備了,很多應(yīng)用場景就能落地。這背后需要精準的目標識別和定位系統(tǒng),我們目前正通過合成數(shù)據(jù)推進這項技術(shù)。
當然,就算解決了這個關(guān)鍵問題,仍有不少任務(wù)是機器人暫時做不了的。但只要攻克了目標識別和定位難題,人形機器人市場至少能達到千億級規(guī)模,而且五年內(nèi)就能看到成效。突破這個技術(shù)瓶頸后,有了龐大的市場投入,機器人肯定能解鎖更多技能,向萬億市場邁進。
機器人形態(tài)與技術(shù)路線
5、國內(nèi)外專家和企業(yè)對“人形”的必要性爭議不斷,有人認為人形是AGI的最終載體,有人認為未來十年人形機器人的占比只有10%,銀河通用如何看待人形的必要性?
王鶴:長遠來看,人形機器人必然要融入人類生活。從終局形態(tài)來說,要在人類環(huán)境中穿梭,既能夠到一兩米高的地方,又能觸碰到地面,還能干活,除了人形,沒有更合適的形態(tài)。
未來幾年,人形機器人會從移動復(fù)合機器人逐步向終局形態(tài)演進。定點機器人只能處理眼前的事,局限性太大,所以移動能力是必須的;但光會移動的設(shè)備(比如工廠里的移動小車)只能運貨,沒法做任何操作。我們現(xiàn)在做的機器人,就是在移動平臺上加裝可升降、可折疊的雙臂——兩只手配合才能完成抱箱子等復(fù)雜操作,這樣的設(shè)計更實用。
未來十年,人形機器人的市場占比會很可觀。目前全球工業(yè)大機械臂總產(chǎn)值約1000億元,而人形機器人按10萬元一臺算,銷量不用太高就能超過這個規(guī)模。我預(yù)計它的產(chǎn)值每三年會翻10倍:現(xiàn)在頭部企業(yè)賣1000臺,三年后能到1萬臺,再三年到10萬臺;按每臺幾十萬元算,10萬臺就能達到千億元規(guī)模,超過現(xiàn)有工業(yè)機械臂的總產(chǎn)值。
所以未來十年,人形機器人市場規(guī)模會超過當前所有工業(yè)機器人;再往后十年,甚至可能達到萬億級,超越汽車、手機市場。不過這需要時間,不會一蹴而就。
6、針對具身智能大腦的基礎(chǔ)模型,宇樹科技主要聚焦哪些方向的探索?能否透露一些具體內(nèi)容?
王興興:我一直認為,目前模型架構(gòu)不統(tǒng)一是導(dǎo)致行業(yè)進展緩慢的原因之一。如果架構(gòu)能更統(tǒng)一、方向更明確,結(jié)合當下的行業(yè)熱度,突破速度會快很多,但現(xiàn)實是進展偏慢。
我們公司嘗試過不少方向。比如去年探索用視頻生成模型作為“世界模型”來驅(qū)動機械臂并實現(xiàn)動作對齊,取得了一些效果,但這類模型訓(xùn)練規(guī)模太大,受限于公司的算力和投入,沒能大規(guī)模推進。而且我們發(fā)現(xiàn)其泛用性也沒達到預(yù)期,后來就沒再繼續(xù)。不過最近谷歌發(fā)布的新視頻生成模型物理對齊效果很好,還公開嘗試將其作為世界模型用于機械臂和通用智能,這讓我覺得這個方向值得重新探索。
受公司規(guī)模、算力和人才限制,我們只是初步嘗試,沒有深入。但谷歌的成果證明了其潛力——視頻生成模型在時間維度、數(shù)據(jù)源和效果上已達到不錯水平。比如生成機器人打掃全屋的視頻后,理論上只要讓機器人動作與視頻對齊,就能實現(xiàn)類似效果,只是目前對齊工作仍復(fù)雜且有挑戰(zhàn)。這個方向?qū)C器人應(yīng)用和視頻生成技術(shù)本身都很重要,大公司也會持續(xù)投入優(yōu)化。
此外還有其他方案。隨著基礎(chǔ)模型能力提升,很多潛力待挖掘。我們發(fā)現(xiàn),在基礎(chǔ)模型訓(xùn)練中加入機器人指令控制和空間理解訓(xùn)練,效果會明顯提升。
我們的策略很簡單:不斷嘗試新模型和想法,根據(jù)情況調(diào)整。新興技術(shù)就該大膽探索,AI領(lǐng)域充滿可能,一個靈感或許就能帶來突破,也希望更多人參與探索。
7、機器人為什么要做雙足?除了情感價值,雙足在商業(yè)上還有哪些考慮?
王興興:其實我之前提過,更該思考的是“為什么不做雙腿”。雙腿設(shè)計相對簡便,更重要的是能提供更強的通用性。運動能力本質(zhì)上屬于較弱的AI能力——你看小動物、螞蟻這些,走路都很靈活,但AI能力其實很低。所以我認為,真正通用且能干活的具身AI模型里,移動能力或腿部功能只是附屬的。
如果機器人能高效完成任務(wù),腿的控制自然不會差;反過來,要是連腿都控制不好,說明還沒達到真正通用的AI模型水平。所以雙腿是一個重要的發(fā)展方向。對我們公司來說,深耕腿部技術(shù)順理成章,而且這個方向本身也很有吸引力,大家普遍認可。再者,要是都去做輪式底盤,容易陷入同質(zhì)化競爭,沒必要。我們專注腿部研發(fā),希望提升機器人的整體運動和作業(yè)能力,這個方向很有前景。
我也做過輪式底盤,清楚輪式和腿式各有優(yōu)劣,且隨著時間變化。目前輪式在工業(yè)開闊場景和貨架間穿梭時,穩(wěn)定性好、能耗低,但面對復(fù)雜環(huán)境可能受限;底盤做小了,穩(wěn)定性又會下降。所以不同階段,機器人下半身的方案必然不同。但我堅信腿是未來——它能讓上半身觸及更大范圍,還能靈活調(diào)動腰部。不過不同階段有不同的最優(yōu)落地形態(tài),我們不會局限于單一方案,現(xiàn)在同時用輪式底盤和人形機器人做全身控制研究。
仿真技術(shù)與物理AI應(yīng)用
8、在像醫(yī)療和養(yǎng)老這樣高精度應(yīng)用場景中,NVIDIA Omniverse如何確保用仿真數(shù)據(jù)訓(xùn)練的機器人具備可靠性和安全性?
Rev:如果你想構(gòu)建一個能夠在現(xiàn)實世界中行動且安全可靠的機器人系統(tǒng),實際上唯一的選擇就是使用仿真。舉個例子,你希望系統(tǒng)足夠智能,能夠應(yīng)對那些很少發(fā)生的特殊情況,甚至應(yīng)對你希望永遠不會發(fā)生的緊急情況。以自動駕駛為例,我們絕對不希望車撞到人或者孩子,但當街上出現(xiàn)小孩時,車輛的大腦該如何反應(yīng),如何獲取訓(xùn)練這類系統(tǒng)的數(shù)據(jù)呢?唯一的辦法就是通過仿真。因為我們絕不可能將孩子置于汽車前作為訓(xùn)練樣本,這樣做是不道德的、危險的,而且耗時且昂貴。
即使訓(xùn)練完系統(tǒng),在將它部署到現(xiàn)實世界之前,也需要在這些相同場景中進行測試,確保在真正發(fā)生類似情況時,它能夠正確反應(yīng)。因此,真正的選擇只有通過仿真實現(xiàn),因為現(xiàn)實世界測試過慢、成本高且危險,我們不希望機器人在現(xiàn)實世界先失敗。換句話說,如果我們無法讓仿真足夠準確以測試機器人,那么我們將無法制造出可靠的機器人。幸運的是,目前已有非常準確的仿真器。不過,這些仿真器計算量大且成本高昂,我們面臨的真正挑戰(zhàn)是如何提升仿真速度,使其在大規(guī)模系統(tǒng)構(gòu)建中具有成本效益,這也是我們一直努力的方向。
9、未來幾年內(nèi),驅(qū)動人工智能機器人的仿真領(lǐng)域會有哪些關(guān)鍵技術(shù)趨勢將改變整個行業(yè)?能否分享一些中國生態(tài)合作伙伴如何利用NVIDIA仿真技術(shù)加速產(chǎn)品創(chuàng)新的案例?
Rev:我認為目前最大的趨勢,實際上是所有在常規(guī)人工智能領(lǐng)域出現(xiàn)的技術(shù)和發(fā)展,正被應(yīng)用到物理人工智能中。其中最重要的突破是推理能力的提升。比如DeepSeek將推理能力帶入了開源領(lǐng)域,現(xiàn)在我們也看到了其他各種模型。
我們在智能水平上實現(xiàn)了飛躍,將同樣的技術(shù)應(yīng)用到物理人工智能,是機器人領(lǐng)域的一個重大突破。如果我們要制造我們剛才談?wù)摰哪欠N機器人——比如能給你拿水的機器人——根據(jù)翻譯理解,可能在今年年底或明年,我們的機器人將能更自然地與人互動,并完成復(fù)雜的多步驟任務(wù)。這是非常關(guān)鍵的能力。而將這種能力與仿真結(jié)合,我認為這是一個可能還未被廣泛理解,但將成為重大突破的點。
目前我們面臨的主要問題是人工智能極度依賴數(shù)據(jù),而獲取合適的數(shù)據(jù)非常困難。我們現(xiàn)有的推理模型,尤其是對物理世界的推理,現(xiàn)在可以幫助我們改善數(shù)據(jù)生成和數(shù)據(jù)創(chuàng)建的流程。
如今我們生成的數(shù)據(jù),即使是合成數(shù)據(jù),也需要大量人工參與,人工去構(gòu)建虛擬世界和仿真環(huán)境,判斷該生成哪些數(shù)據(jù)才能讓智能系統(tǒng)更聰明。但是,如果我們把正在開發(fā)的人工智能技術(shù)用在數(shù)據(jù)生成流程中,就可以實現(xiàn)自動化,打造“自動駕駛”的合成數(shù)據(jù)生成。
如果我們擁有一個自動駕駛的合成數(shù)據(jù)生成工廠,就能直接將其接入訓(xùn)練流程,實現(xiàn)訓(xùn)練過程自動化,減少人為干預(yù),讓機器人大腦更聰明。至于中國的企業(yè)如何應(yīng)用仿真技術(shù)及其帶來的影響,我認為他們已經(jīng)在積極探索和應(yīng)用這些技術(shù)。