訂閱
糾錯(cuò)
加入自媒體

算力不夠,智慧來湊?Deepseek們正在擺脫算力崇拜

圖片

算力神話正在松動(dòng)

在科技圈,硅谷一直有一種“造物主”般的傲慢。從大模型誕生那天起,OpenAI的 CEO奧特曼就給全世界洗腦了一套暴力美學(xué):智能等于算力,算力等于顯卡,顯卡等于成功。

但這套邏輯,正在被一群中國“算法瘋子”拆解。

近日, Google的一項(xiàng)研究發(fā)現(xiàn),DeepSeek的R1和阿里云的qwq-32B模型,竟然能夠模仿人類的集體智能。

簡單說,在處理難題時(shí),不再是一個(gè)人在戰(zhàn)斗,而是在內(nèi)部演化出了一個(gè)“思想社會(huì)”。其中不同人格特征和領(lǐng)域?qū)I(yè)知識(shí)的相互作用產(chǎn)生了更強(qiáng)大的能力。

大模型行業(yè)從不缺“堆料者”,但能讓 Google 彎下腰來研究底層邏輯的,寥寥無幾。這不僅是技術(shù)的勝利,更是中國企業(yè)在算力圍堵下,硬生生走出的一條“暴力效率主義”血路。

Deepseek更懂“省錢”

長期以來,硅谷的大模型發(fā)展路徑高度趨同甚至單一:堆最貴的卡,組最多的集群,投入最激進(jìn)的資本。

從 GPT-3 到 GPT-4,再到 GPT-4o,這條路線被一次次驗(yàn)證有效。Meta 為了 Llama 3 囤積了數(shù)十萬張 GPU,微軟與 OpenAI 推進(jìn)的“星際門”項(xiàng)目,投資規(guī)模動(dòng)輒以千億美元計(jì),覆蓋算力、數(shù)據(jù)中心、電力基礎(chǔ)設(shè)施等全鏈條。這種打法并不復(fù)雜,本質(zhì)上是通過資源冗余換取確定性領(lǐng)先。

換句話說,當(dāng)算力足夠便宜、資本足夠充裕時(shí),工程效率往往并非首要約束,真正重要的是“規(guī)模先到位”。

但 Google 這份研究揭開了另一個(gè)真相:DeepSeek 們之所以強(qiáng),不是因?yàn)樗鼈儽?OpenAI 更能燒錢,而是它們更懂“省錢”。

研究指出,DeepSeek 等中國模型的能力躍遷,并非來自算力規(guī)模的指數(shù)級(jí)擴(kuò)張,而是來自推理階段內(nèi)部結(jié)構(gòu)的重構(gòu)。

這些模型在面對復(fù)雜指令時(shí),并不是沿著單一生成路徑一路向前,而是會(huì)在內(nèi)部并行展開多種解題策略,并通過持續(xù)的內(nèi)部比較、博弈與修正,逐步收斂到更穩(wěn)定的答案。

這種近似“多代理協(xié)商”的模式,并不追求單次推理速度的極限,卻顯著降低了單位算力下的錯(cuò)誤率與返工成本。在算力受限的環(huán)境中,這種“少走彎路”的能力,往往比“跑得更快”更重要。

正是在這一背景下,MoE與 GRPO等技術(shù)路徑開始在國內(nèi)模型中被高度重視。MoE 通過將模型能力拆分給不同“專家模塊”,避免了每一次推理都全模型啟動(dòng);GRPO 則通過分組對比和相對優(yōu)化,提升模型在推理階段的穩(wěn)定性和可控性。

這類技術(shù)選擇的共同目標(biāo)只有一個(gè):把有限算力的“智能產(chǎn)出”榨到極致。

這并不是一次偶然的技術(shù)選擇,而是一種被現(xiàn)實(shí)約束反復(fù)塑造出的工程哲學(xué)。

如果說硅谷仍在押注“重裝推進(jìn)”的工業(yè)化路線,那么中國模型更像是在修煉一套輕量而高效的技術(shù)體系。通過結(jié)構(gòu)、策略和調(diào)度上的精細(xì)設(shè)計(jì),對沖算力劣勢。

這種“算法效率主義”并非理想主義,而是一種典型的生存型進(jìn)化。當(dāng)資源不再無限供給,效率本身就會(huì)從加分項(xiàng),轉(zhuǎn)變?yōu)樽詈诵、也最難復(fù)制的競爭壁壘。

大廠護(hù)城河的坍塌

在 Google 的研究案例中,被反復(fù)引用的中國模型,并不是聲量最大、發(fā)布會(huì)最密集的玩家,而是 DeepSeek和阿里通義千問。這并非簡單的“技術(shù)偶然”,而是中國 AI 競爭的“分水嶺”已經(jīng)出現(xiàn)了。

過去兩年,國內(nèi)大廠們沉迷于參數(shù)對標(biāo)、榜單排名和在發(fā)布會(huì)上“吊打 GPT-4”,忙著在朋友圈曬各種看不懂的榜單,這些能在短期內(nèi)贏得更多注意力。

但從基礎(chǔ)研究和工程演化的角度看,這種競爭方式的邊際價(jià)值正在快速下降。真正進(jìn)入全球研究視野的,反而是那些持續(xù)在模型架構(gòu)、推理效率和成本結(jié)構(gòu)上做“臟活累活”的團(tuán)隊(duì)。

DeepSeek 背靠幻方量化,其技術(shù)團(tuán)隊(duì)長期浸泡在金融工程語境中,對算力成本、延遲控制和穩(wěn)定性有著近乎苛刻的要求。在量化交易領(lǐng)域,算力從來不是無限變量,“如何用更少計(jì)算得到更可靠結(jié)論”本身就是核心能力。

因此,DeepSeek 從一開始就沒有將重心放在應(yīng)用層敘事上,而是持續(xù)死磕推理成本與模型結(jié)構(gòu)。即便沒有萬卡集群,只要架構(gòu)足夠聰明,依然可以逼近前沿能力。

圖片

而阿里通義千問所選擇的路徑,則更具平臺(tái)型特征。

通過持續(xù)開源模型底座,阿里將模型訓(xùn)練、評測和場景驗(yàn)證的一部分成本,轉(zhuǎn)化為全球開發(fā)者的協(xié)同實(shí)驗(yàn)。這種做法短期內(nèi)看似削弱了“獨(dú)占優(yōu)勢”,但從長期看,卻顯著加快了模型在真實(shí)復(fù)雜場景中的演化速度。

在這種開放體系中,模型更容易暴露問題,也更快完成修正,從而在模擬“集體智慧”與復(fù)雜決策方面走得更遠(yuǎn)。

反觀某些還沉溺于做“套殼應(yīng)用”或只顧著買流量的大廠,護(hù)城河正在變得搖搖欲墜。應(yīng)用層的繁榮,建立在底層能力外包的基礎(chǔ)之上,一旦底層模型的差距被拉開,應(yīng)用層的優(yōu)勢往往難以長期維持。

互聯(lián)網(wǎng)行業(yè)從不缺跨界者,但真正成功的寥寥無幾。因?yàn)榈讓舆壿嬕坏╁e(cuò)位,再多的產(chǎn)品包裝也只是階段性繁榮。

在 AI 領(lǐng)域,如果不能在算法或架構(gòu)層貢獻(xiàn)新的認(rèn)知與方法論,那么競爭最終只會(huì)被壓縮到應(yīng)用層的價(jià)格戰(zhàn)與內(nèi)卷之中,而這,恰恰是最容易被后來者顛覆的地帶。

智能的“社會(huì)化”

Google 的這項(xiàng)研究,最細(xì)思極恐的地方在于:如果 AI 內(nèi)部已經(jīng)能模擬“集體智慧”,那么人類精英的價(jià)值還剩下多少?

研究提到,DeepSeek R1 等模型展現(xiàn)出的“內(nèi)部辯論”能力,本質(zhì)上,這意味著人類組織中大量依賴流程協(xié)作的崗位,將不可避免地被重新定義。

過去,一個(gè)大型企業(yè)的重大決策,往往需要多個(gè)部門參與:市場調(diào)研、戰(zhàn)略分析、風(fēng)險(xiǎn)評估、財(cái)務(wù)測算……

而現(xiàn)在,一個(gè)具備強(qiáng)推理能力的 AI Agent,已經(jīng)可以在內(nèi)部完成成百上千次模擬。

這并不是“自動(dòng)化”,而是決策機(jī)制的內(nèi)化。

對于字節(jié)跳動(dòng)、美團(tuán)、百度這類高度依賴數(shù)據(jù)與算法的公司而言,這意味著從“人機(jī)協(xié)作”向“機(jī)機(jī)協(xié)作”的過渡。

對于制造業(yè)巨頭,如小米、比亞迪而言,這意味著供應(yīng)鏈與生產(chǎn)系統(tǒng)將第一次擁有“自反能力”。

它們不只是執(zhí)行命令,而是能夠?qū)γ畋旧硖岢鲑|(zhì)疑。

這也是為什么,越來越多企業(yè)開始將強(qiáng)推理模型引入非前端場景。不是為了聊天,而是為了判斷。

回到最初的問題:算力不夠,智慧真的能來湊嗎?

DeepSeek 與 千問給出的答案是:當(dāng)資源不再無限,智慧才會(huì)被迫進(jìn)化。

歷史反復(fù)證明,真正改變世界的技術(shù)路徑,往往誕生于約束之中,而不是溫室里。

今天,中國 AI 正在用一種并不張揚(yáng)、卻高度有效的方式,重寫大模型的競爭邏輯。

它未必最快,但可能更穩(wěn);未必最貴,但更可持續(xù)。

而這,或許正是下一階段智能競爭的關(guān)鍵分水嶺。

馬斯克曾多次強(qiáng)調(diào):“未來所有的工作都將由 AI 完成,除非你想為了興趣而工作。”當(dāng)中國 AI 提前摸到了“集體智慧”的門檻,這種預(yù)測正加速從科幻變?yōu)楝F(xiàn)實(shí)。

       原文標(biāo)題 : 算力不夠,智慧來湊?Deepseek們正在擺脫算力崇拜

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)