123,123,123

“明牌”對(duì)局，自變量開源模型超越pi0

2026-01-12 10:26

近日，全球首個(gè)大規(guī)模多任務(wù)的真機(jī)基準(zhǔn)測試平臺(tái)RoboChallenge榜單更新，前三名依次為pi0.5、WALL-OSS和pi0。

科普時(shí)間到，pi0.5、pi0是出自美國公司 Physical Intelliqence的操作大模型，WALL-OSS是出自中國自變量機(jī)器人的全自研開源操作大模型，不僅能完成操作，而且能同時(shí)生成復(fù)雜推理過程。

這一結(jié)果釋放出強(qiáng)烈的信號(hào)。很長一段時(shí)間內(nèi)，中國具身智能產(chǎn)業(yè)陷入“大腦缺位”的爭議：我們有較強(qiáng)的本體結(jié)構(gòu)設(shè)計(jì)和運(yùn)控算法，但很難讓機(jī)器人真正“用腦思考”，自主與物理世界交互，進(jìn)而帶來創(chuàng)造生產(chǎn)力的可能。但現(xiàn)在，中國具身智能模型已經(jīng)與海外頂級(jí)模型同臺(tái)共舞。

更有意思的是，自變量和pi高度默契地選擇將模型開源。看似偶然的戰(zhàn)略趨同，實(shí)則是具身智能產(chǎn)業(yè)發(fā)展到關(guān)鍵階段的必然選擇。

在RoboChallenge的最新測試中，自變量WALL-OSS展現(xiàn)了極強(qiáng)的競技狀態(tài)，總分位居第二，超越了明星模型pi0。在疊洗碗巾、按按鈕、澆盆栽等多個(gè)任務(wù)中，WALL-OSS的得分摘得桂冠，排名第一。

先來劃個(gè)重點(diǎn)。

RoboChallenge的測試或許更像是一場“開卷考試”，因?yàn)閿?shù)十個(gè)桌面任務(wù)與場景都是預(yù)知的。這就相當(dāng)于提前布置考題。

而WALL-OSS作為開源模型，某種程度上相當(dāng)于明牌上場，其每一步操作都真實(shí)可見為模型驅(qū)動(dòng)，更多的意義在于給出解題思路，“進(jìn)一步展示模型的真實(shí)性能”。

與用閉源模型參與測評(píng)的“黑箱”，不知任務(wù)究竟如何完成不同，WALL-OSS作為開源模型，其一舉一動(dòng)相當(dāng)于“明牌”炸場，換句話說其核心能力均可通過公開的代碼和參數(shù)得到完整解釋和復(fù)現(xiàn)，其在榜單上的成績完全是模型真實(shí)能力的直接體現(xiàn)，是無法摻水，難以被“操作”的硬核實(shí)力證明。

從技術(shù)細(xì)節(jié)來看，WALL-OSS取得優(yōu)異成績的核心在于對(duì)“端到端”架構(gòu)的深度重構(gòu)：

它依托創(chuàng)新的混合專家（MoE）架構(gòu)及“共享注意力+專家分流”設(shè)計(jì)，有效解決了視覺語言模型向具身模型遷移時(shí)的“災(zāi)難性遺忘”與“模態(tài)解耦”難題；

通過“先離散、后連續(xù)、再聯(lián)合”的三階段訓(xùn)練范式，消除了“認(rèn)知與動(dòng)作脫節(jié)”的痛點(diǎn)，使模型能精準(zhǔn)掌控如澆盆栽時(shí)的動(dòng)作力度；

此外，其內(nèi)化的跨層級(jí)思維鏈推理能力，實(shí)現(xiàn)了高層決策與底層執(zhí)行的無縫切換，使其在面對(duì)各類突發(fā)狀況時(shí)，仍能精準(zhǔn)控制關(guān)節(jié)完成復(fù)雜任務(wù)。

有個(gè)小插曲，WALL-OSS去年9月開源，與Physical Intelligence開源pi0.5相錯(cuò)一天，這也側(cè)面說明了自變量的技術(shù)步調(diào)一直與國際頭部具身大腦公司同頻。而今天自變量與Physical Intelligence的模型又在榜單前排聚首，更說明自變量已經(jīng)站穩(wěn)了全球第一梯隊(duì)。

開源之所以重要，在于生態(tài)建設(shè)，其價(jià)值最終體現(xiàn)在生態(tài)的繁榮之上。

自變量認(rèn)為，在具身智能這一軟硬件深度耦合的前沿領(lǐng)域，構(gòu)建一個(gè)高質(zhì)量的開源基礎(chǔ)模型底座，是加速整個(gè)行業(yè)生態(tài)繁榮的堅(jiān)實(shí)“地基”，也是實(shí)現(xiàn)機(jī)器人在物理世界大規(guī)模、穩(wěn)定交互的關(guān)鍵。

當(dāng)前，機(jī)器人模型的驗(yàn)證鏈路冗長，行業(yè)里專用小模型、通用大模型質(zhì)量參差不齊，基礎(chǔ)模型、專用模型、微調(diào)模型混雜，且缺乏統(tǒng)一的評(píng)價(jià)標(biāo)準(zhǔn)。開源是撥開迷霧、推動(dòng)行業(yè)標(biāo)準(zhǔn)化和成熟化的必由之路。

在《硅谷101播客》中，自變量聯(lián)合創(chuàng)始人兼CTO王昊曾說：“我一直都覺得開源是非常重要的事情，開源意味著我們可以站在巨人的肩膀上繼續(xù)前進(jìn)。我們可以基于已有成果做更多的改進(jìn)，社區(qū)開發(fā)者的反饋也會(huì)幫助到開源的公司，開源公司可以從中吸取到經(jīng)驗(yàn)，然后把這個(gè)技術(shù)路線思考得更加深入。”

自變量開源的WALL-OSS正是秉承這種“提供肩膀”的開源理念，所以他們選擇更為徹底的開放：不僅開放了預(yù)訓(xùn)練模型權(quán)重、完整訓(xùn)練代碼和數(shù)據(jù)集接口，甚至還提供了詳盡的部署文檔。

除了構(gòu)建行業(yè)繁榮生態(tài)之外，“站在巨人肩膀上”還在于避免行業(yè)陷入重復(fù)性研發(fā)的低效困境——無需每個(gè)企業(yè)、每個(gè)研究者都從零開始“一手手自建高樓”，而是可以基于開源的基礎(chǔ)模型快速迭代創(chuàng)新，將更多精力投入到差異化技術(shù)研發(fā)與場景化應(yīng)用落地中，大幅提升整個(gè)行業(yè)的創(chuàng)新效率。

黃仁勛也曾直白說過，“開源如此重要的原因，在于沒有開源初創(chuàng)企業(yè)不能蓬勃發(fā)展，大學(xué)研究人員不能做研究，科學(xué)家不能使用人工智能�；旧�，你的經(jīng)濟(jì)沒有能力從根本上提升自己”。這不僅適用于AI，對(duì)于具身智能和任何技術(shù)來說都是如此。