訂閱
糾錯(cuò)
加入自媒體

“明牌”對(duì)局,自變量開源模型超越pi0

2026-01-12 10:26
腦極體
關(guān)注

圖片

近日,全球首個(gè)大規(guī)模多任務(wù)的真機(jī)基準(zhǔn)測試平臺(tái)RoboChallenge榜單更新,前三名依次為pi0.5、WALL-OSS和pi0。

科普時(shí)間到,pi0.5、pi0是出自美國公司 Physical Intelliqence的操作大模型,WALL-OSS是出自中國自變量機(jī)器人的全自研開源操作大模型,不僅能完成操作,而且能同時(shí)生成復(fù)雜推理過程。

這一結(jié)果釋放出強(qiáng)烈的信號(hào)。很長一段時(shí)間內(nèi),中國具身智能產(chǎn)業(yè)陷入“大腦缺位”的爭議:我們有較強(qiáng)的本體結(jié)構(gòu)設(shè)計(jì)和運(yùn)控算法,但很難讓機(jī)器人真正“用腦思考”,自主與物理世界交互,進(jìn)而帶來創(chuàng)造生產(chǎn)力的可能。但現(xiàn)在,中國具身智能模型已經(jīng)與海外頂級(jí)模型同臺(tái)共舞。

更有意思的是,自變量和pi高度默契地選擇將模型開源。看似偶然的戰(zhàn)略趨同,實(shí)則是具身智能產(chǎn)業(yè)發(fā)展到關(guān)鍵階段的必然選擇。

圖片

在RoboChallenge的最新測試中,自變量WALL-OSS展現(xiàn)了極強(qiáng)的競技狀態(tài),總分位居第二,超越了明星模型pi0。在疊洗碗巾、按按鈕、澆盆栽等多個(gè)任務(wù)中,WALL-OSS的得分摘得桂冠,排名第一。

圖片

先來劃個(gè)重點(diǎn)。

RoboChallenge的測試或許更像是一場“開卷考試”,因?yàn)閿?shù)十個(gè)桌面任務(wù)與場景都是預(yù)知的。這就相當(dāng)于提前布置考題。

而WALL-OSS作為開源模型,某種程度上相當(dāng)于明牌上場,其每一步操作都真實(shí)可見為模型驅(qū)動(dòng),更多的意義在于給出解題思路,“進(jìn)一步展示模型的真實(shí)性能”。

與用閉源模型參與測評(píng)的“黑箱”,不知任務(wù)究竟如何完成不同,WALL-OSS作為開源模型,其一舉一動(dòng)相當(dāng)于“明牌”炸場,換句話說其核心能力均可通過公開的代碼和參數(shù)得到完整解釋和復(fù)現(xiàn),其在榜單上的成績完全是模型真實(shí)能力的直接體現(xiàn),是無法摻水,難以被“操作”的硬核實(shí)力證明。

從技術(shù)細(xì)節(jié)來看,WALL-OSS取得優(yōu)異成績的核心在于對(duì)“端到端”架構(gòu)的深度重構(gòu):

圖片

它依托創(chuàng)新的混合專家(MoE)架構(gòu)及“共享注意力+專家分流”設(shè)計(jì),有效解決了視覺語言模型向具身模型遷移時(shí)的“災(zāi)難性遺忘”與“模態(tài)解耦”難題;

通過“先離散、后連續(xù)、再聯(lián)合”的三階段訓(xùn)練范式,消除了“認(rèn)知與動(dòng)作脫節(jié)”的痛點(diǎn),使模型能精準(zhǔn)掌控如澆盆栽時(shí)的動(dòng)作力度;

此外,其內(nèi)化的跨層級(jí)思維鏈推理能力,實(shí)現(xiàn)了高層決策與底層執(zhí)行的無縫切換,使其在面對(duì)各類突發(fā)狀況時(shí),仍能精準(zhǔn)控制關(guān)節(jié)完成復(fù)雜任務(wù)。

有個(gè)小插曲,WALL-OSS去年9月開源,與Physical Intelligence開源pi0.5相錯(cuò)一天,這也側(cè)面說明了自變量的技術(shù)步調(diào)一直與國際頭部具身大腦公司同頻。而今天自變量與Physical Intelligence的模型又在榜單前排聚首,更說明自變量已經(jīng)站穩(wěn)了全球第一梯隊(duì)。

圖片

開源之所以重要,在于生態(tài)建設(shè),其價(jià)值最終體現(xiàn)在生態(tài)的繁榮之上。

自變量認(rèn)為,在具身智能這一軟硬件深度耦合的前沿領(lǐng)域,構(gòu)建一個(gè)高質(zhì)量的開源基礎(chǔ)模型底座,是加速整個(gè)行業(yè)生態(tài)繁榮的堅(jiān)實(shí)“地基”,也是實(shí)現(xiàn)機(jī)器人在物理世界大規(guī)模、穩(wěn)定交互的關(guān)鍵。

當(dāng)前,機(jī)器人模型的驗(yàn)證鏈路冗長,行業(yè)里專用小模型、通用大模型質(zhì)量參差不齊,基礎(chǔ)模型、專用模型、微調(diào)模型混雜,且缺乏統(tǒng)一的評(píng)價(jià)標(biāo)準(zhǔn)。開源是撥開迷霧、推動(dòng)行業(yè)標(biāo)準(zhǔn)化和成熟化的必由之路。

在《硅谷101播客》中,自變量聯(lián)合創(chuàng)始人兼CTO王昊曾說:“我一直都覺得開源是非常重要的事情,開源意味著我們可以站在巨人的肩膀上繼續(xù)前進(jìn)。我們可以基于已有成果做更多的改進(jìn),社區(qū)開發(fā)者的反饋也會(huì)幫助到開源的公司,開源公司可以從中吸取到經(jīng)驗(yàn),然后把這個(gè)技術(shù)路線思考得更加深入。”

圖片

自變量開源的WALL-OSS正是秉承這種“提供肩膀”的開源理念,所以他們選擇更為徹底的開放:不僅開放了預(yù)訓(xùn)練模型權(quán)重、完整訓(xùn)練代碼和數(shù)據(jù)集接口,甚至還提供了詳盡的部署文檔。

除了構(gòu)建行業(yè)繁榮生態(tài)之外,“站在巨人肩膀上”還在于避免行業(yè)陷入重復(fù)性研發(fā)的低效困境——無需每個(gè)企業(yè)、每個(gè)研究者都從零開始“一手手自建高樓”,而是可以基于開源的基礎(chǔ)模型快速迭代創(chuàng)新,將更多精力投入到差異化技術(shù)研發(fā)與場景化應(yīng)用落地中,大幅提升整個(gè)行業(yè)的創(chuàng)新效率。

黃仁勛也曾直白說過,“開源如此重要的原因,在于沒有開源初創(chuàng)企業(yè)不能蓬勃發(fā)展,大學(xué)研究人員不能做研究,科學(xué)家不能使用人工智能;旧,你的經(jīng)濟(jì)沒有能力從根本上提升自己”。這不僅適用于AI,對(duì)于具身智能和任何技術(shù)來說都是如此。

圖片

事實(shí)上,技術(shù)革命的背后就是一場技術(shù)大規(guī)模應(yīng)用并改變生產(chǎn)方式的過程。如果沒有應(yīng)用也就把技術(shù)困厄于象牙塔,無法激起漣漪。

如自變量所說“擁抱開源,以透明對(duì)抗虛假,以協(xié)作代替閉門造車”,具身行業(yè)這條厚雪長坡上,需要的是明燈而非迷霧,眾人拾柴而非孤芳自賞。而開源,正是那盞能夠照亮前路、匯聚眾力的燈。

圖片

       原文標(biāo)題 : “明牌”對(duì)局,自變量開源模型超越pi0

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)