123,123,123

算力不夠，智慧來湊？Deepseek們正在擺脫算力崇拜

2026-01-26 10:51

算力神話正在松動(dòng)

在科技圈，硅谷一直有一種“造物主”般的傲慢。從大模型誕生那天起，OpenAI的 CEO奧特曼就給全世界洗腦了一套暴力美學(xué)：智能等于算力，算力等于顯卡，顯卡等于成功。

但這套邏輯，正在被一群中國“算法瘋子”拆解。

近日， Google的一項(xiàng)研究發(fā)現(xiàn)，DeepSeek的R1和阿里云的qwq-32B模型，竟然能夠模仿人類的集體智能。

簡單說，在處理難題時(shí)，不再是一個(gè)人在戰(zhàn)斗，而是在內(nèi)部演化出了一個(gè)“思想社會(huì)”。其中不同人格特征和領(lǐng)域?qū)I(yè)知識(shí)的相互作用產(chǎn)生了更強(qiáng)大的能力。

大模型行業(yè)從不缺“堆料者”，但能讓 Google 彎下腰來研究底層邏輯的，寥寥無幾。這不僅是技術(shù)的勝利，更是中國企業(yè)在算力圍堵下，硬生生走出的一條“暴力效率主義”血路。

Deepseek更懂“省錢”

長期以來，硅谷的大模型發(fā)展路徑高度趨同甚至單一：堆最貴的卡，組最多的集群，投入最激進(jìn)的資本。

從 GPT-3 到 GPT-4，再到 GPT-4o，這條路線被一次次驗(yàn)證有效。Meta 為了 Llama 3 囤積了數(shù)十萬張 GPU，微軟與 OpenAI 推進(jìn)的“星際門”項(xiàng)目，投資規(guī)模動(dòng)輒以千億美元計(jì)，覆蓋算力、數(shù)據(jù)中心、電力基礎(chǔ)設(shè)施等全鏈條。這種打法并不復(fù)雜，本質(zhì)上是通過資源冗余換取確定性領(lǐng)先。

換句話說，當(dāng)算力足夠便宜、資本足夠充裕時(shí)，工程效率往往并非首要約束，真正重要的是“規(guī)模先到位”。

但 Google 這份研究揭開了另一個(gè)真相：DeepSeek 們之所以強(qiáng)，不是因?yàn)樗鼈儽?OpenAI 更能燒錢，而是它們更懂“省錢”。

研究指出，DeepSeek 等中國模型的能力躍遷，并非來自算力規(guī)模的指數(shù)級(jí)擴(kuò)張，而是來自推理階段內(nèi)部結(jié)構(gòu)的重構(gòu)。

這些模型在面對復(fù)雜指令時(shí)，并不是沿著單一生成路徑一路向前，而是會(huì)在內(nèi)部并行展開多種解題策略，并通過持續(xù)的內(nèi)部比較、博弈與修正，逐步收斂到更穩(wěn)定的答案。

這種近似“多代理協(xié)商”的模式，并不追求單次推理速度的極限，卻顯著降低了單位算力下的錯(cuò)誤率與返工成本。在算力受限的環(huán)境中，這種“少走彎路”的能力，往往比“跑得更快”更重要。

正是在這一背景下，MoE與 GRPO等技術(shù)路徑開始在國內(nèi)模型中被高度重視。MoE 通過將模型能力拆分給不同“專家模塊”，避免了每一次推理都全模型啟動(dòng)；GRPO 則通過分組對比和相對優(yōu)化，提升模型在推理階段的穩(wěn)定性和可控性。

這類技術(shù)選擇的共同目標(biāo)只有一個(gè)：把有限算力的“智能產(chǎn)出”榨到極致。

這并不是一次偶然的技術(shù)選擇，而是一種被現(xiàn)實(shí)約束反復(fù)塑造出的工程哲學(xué)。

如果說硅谷仍在押注“重裝推進(jìn)”的工業(yè)化路線，那么中國模型更像是在修煉一套輕量而高效的技術(shù)體系。通過結(jié)構(gòu)、策略和調(diào)度上的精細(xì)設(shè)計(jì)，對沖算力劣勢。

這種“算法效率主義”并非理想主義，而是一種典型的生存型進(jìn)化。當(dāng)資源不再無限供給，效率本身就會(huì)從加分項(xiàng)，轉(zhuǎn)變?yōu)樽詈诵�、也最難復(fù)制的競爭壁壘。

大廠護(hù)城河的坍塌

在 Google 的研究案例中，被反復(fù)引用的中國模型，并不是聲量最大、發(fā)布會(huì)最密集的玩家，而是 DeepSeek和阿里通義千問。這并非簡單的“技術(shù)偶然”，而是中國 AI 競爭的“分水嶺”已經(jīng)出現(xiàn)了。

過去兩年，國內(nèi)大廠們沉迷于參數(shù)對標(biāo)、榜單排名和在發(fā)布會(huì)上“吊打 GPT-4”，忙著在朋友圈曬各種看不懂的榜單，這些能在短期內(nèi)贏得更多注意力。

但從基礎(chǔ)研究和工程演化的角度看，這種競爭方式的邊際價(jià)值正在快速下降。真正進(jìn)入全球研究視野的，反而是那些持續(xù)在模型架構(gòu)、推理效率和成本結(jié)構(gòu)上做“臟活累活”的團(tuán)隊(duì)。

DeepSeek 背靠幻方量化，其技術(shù)團(tuán)隊(duì)長期浸泡在金融工程語境中，對算力成本、延遲控制和穩(wěn)定性有著近乎苛刻的要求。在量化交易領(lǐng)域，算力從來不是無限變量，“如何用更少計(jì)算得到更可靠結(jié)論”本身就是核心能力。

因此，DeepSeek 從一開始就沒有將重心放在應(yīng)用層敘事上，而是持續(xù)死磕推理成本與模型結(jié)構(gòu)。即便沒有萬卡集群，只要架構(gòu)足夠聰明，依然可以逼近前沿能力。

而阿里通義千問所選擇的路徑，則更具平臺(tái)型特征。

通過持續(xù)開源模型底座，阿里將模型訓(xùn)練、評測和場景驗(yàn)證的一部分成本，轉(zhuǎn)化為全球開發(fā)者的協(xié)同實(shí)驗(yàn)。這種做法短期內(nèi)看似削弱了“獨(dú)占優(yōu)勢”，但從長期看，卻顯著加快了模型在真實(shí)復(fù)雜場景中的演化速度。

在這種開放體系中，模型更容易暴露問題，也更快完成修正，從而在模擬“集體智慧”與復(fù)雜決策方面走得更遠(yuǎn)。

反觀某些還沉溺于做“套殼應(yīng)用”或只顧著買流量的大廠，護(hù)城河正在變得搖搖欲墜。應(yīng)用層的繁榮，建立在底層能力外包的基礎(chǔ)之上，一旦底層模型的差距被拉開，應(yīng)用層的優(yōu)勢往往難以長期維持。

互聯(lián)網(wǎng)行業(yè)從不缺跨界者，但真正成功的寥寥無幾。因?yàn)榈讓舆壿嬕坏╁e(cuò)位，再多的產(chǎn)品包裝也只是階段性繁榮。

在 AI 領(lǐng)域，如果不能在算法或架構(gòu)層貢獻(xiàn)新的認(rèn)知與方法論，那么競爭最終只會(huì)被壓縮到應(yīng)用層的價(jià)格戰(zhàn)與內(nèi)卷之中，而這，恰恰是最容易被后來者顛覆的地帶。

智能的“社會(huì)化”

Google 的這項(xiàng)研究，最細(xì)思極恐的地方在于：如果 AI 內(nèi)部已經(jīng)能模擬“集體智慧”，那么人類精英的價(jià)值還剩下多少？

研究提到，DeepSeek R1 等模型展現(xiàn)出的“內(nèi)部辯論”能力，本質(zhì)上，這意味著人類組織中大量依賴流程協(xié)作的崗位，將不可避免地被重新定義。

過去，一個(gè)大型企業(yè)的重大決策，往往需要多個(gè)部門參與：市場調(diào)研、戰(zhàn)略分析、風(fēng)險(xiǎn)評估、財(cái)務(wù)測算……

而現(xiàn)在，一個(gè)具備強(qiáng)推理能力的 AI Agent，已經(jīng)可以在內(nèi)部完成成百上千次模擬。

這并不是“自動(dòng)化”，而是決策機(jī)制的內(nèi)化。

對于字節(jié)跳動(dòng)、美團(tuán)、百度這類高度依賴數(shù)據(jù)與算法的公司而言，這意味著從“人機(jī)協(xié)作”向“機(jī)機(jī)協(xié)作”的過渡。

對于制造業(yè)巨頭，如小米、比亞迪而言，這意味著供應(yīng)鏈與生產(chǎn)系統(tǒng)將第一次擁有“自反能力”。

它們不只是執(zhí)行命令，而是能夠?qū)γ畋旧硖岢鲑|(zhì)疑。

這也是為什么，越來越多企業(yè)開始將強(qiáng)推理模型引入非前端場景。不是為了聊天，而是為了判斷。

回到最初的問題：算力不夠，智慧真的能來湊嗎？

DeepSeek 與千問給出的答案是：當(dāng)資源不再無限，智慧才會(huì)被迫進(jìn)化。

歷史反復(fù)證明，真正改變世界的技術(shù)路徑，往往誕生于約束之中，而不是溫室里。

今天，中國 AI 正在用一種并不張揚(yáng)、卻高度有效的方式，重寫大模型的競爭邏輯。

它未必最快，但可能更穩(wěn)；未必最貴，但更可持續(xù)。

而這，或許正是下一階段智能競爭的關(guān)鍵分水嶺。

馬斯克曾多次強(qiáng)調(diào)：“未來所有的工作都將由 AI 完成，除非你想為了興趣而工作。”當(dāng)中國 AI 提前摸到了“集體智慧”的門檻，這種預(yù)測正加速從科幻變?yōu)楝F(xiàn)實(shí)。

原文標(biāo)題 : 算力不夠，智慧來湊？Deepseek們正在擺脫算力崇拜

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號(hào)的作者撰寫，觀點(diǎn)僅代表作者本人，不代表OFweek立場。如有侵權(quán)或其他問題，請聯(lián)系舉報(bào)。

發(fā)表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務(wù)

忘記密碼

其他方式

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

暫無評論

圖片新聞