訂閱
糾錯(cuò)
加入自媒體

算力競(jìng)速(上):GPU如何蛻變?yōu)锳I時(shí)代的新石油

文|錢(qián)眼君

來(lái)源|博望財(cái)經(jīng)

歲末年初,中國(guó)資本市場(chǎng)的聚光燈前所未有地聚焦于黃浦江畔。一場(chǎng)聲勢(shì)浩大的“GPU旋風(fēng)”正席卷而來(lái):在不到一個(gè)月的時(shí)間里,沐曦股份、壁仞科技、天數(shù)智芯三家扎根上海的GPU企業(yè)密集登陸資本市場(chǎng),而與其并稱(chēng)“上海GPU四小龍”的燧原科技,也已完成IPO輔導(dǎo),即將為這場(chǎng)盛宴落下最后一塊拼圖。

從科創(chuàng)板首日暴漲692.95%的造富神話,到港交所超2300倍的驚人認(rèn)購(gòu)紀(jì)錄;從百億級(jí)的IPO募資規(guī)模到千億市值俱樂(lè)部的批量誕生,國(guó)產(chǎn)GPU企業(yè)正以其凌厲的資本攻勢(shì),宣告著國(guó)產(chǎn)算力產(chǎn)業(yè)一個(gè)新時(shí)代的來(lái)臨。

這并非偶然的資本狂歡。沐曦股份憑借在手訂單14.3億元及"千卡集群"的商業(yè)化落地,上市首日市值即突破3000億元,創(chuàng)下多項(xiàng)紀(jì)錄;壁仞科技作為"港股國(guó)產(chǎn)GPU第一股",獲得23家基石投資者力挺;天數(shù)智芯則以首家實(shí)現(xiàn)國(guó)產(chǎn)7nm訓(xùn)練推理通用GPU量產(chǎn)的身份,攜覆蓋20多個(gè)行業(yè)的業(yè)績(jī)登陸港交所。

然而,光環(huán)之下亦有隱憂:天數(shù)智芯三年半累計(jì)虧損超28億元,壁仞科技同期虧損超63億元,揭示出這個(gè)高投入、高風(fēng)險(xiǎn)行業(yè)在搶占窗口期時(shí)的"流血沖鋒"本質(zhì)。

這是一場(chǎng)關(guān)乎智能未來(lái)的產(chǎn)業(yè)競(jìng)速賽:一邊是國(guó)際巨頭以"黃氏定律"般的速度壘高技術(shù)壁壘,一邊是中國(guó)本土力量在資本與政策的雙重加持下集體破局。而要理解這場(chǎng)競(jìng)賽的深層邏輯,我們必須回溯GPU從游戲配件到算力核心的蛻變之路。

01

定義核心:從圖形助手到算力引擎的蛻變

在探討這場(chǎng)席卷全球的算力革命之前,我們先來(lái)厘清一個(gè)核心概念——GPU。GPU全稱(chēng)Graphics Processing Unit,圖形處理器。我們常聽(tīng)說(shuō)的CPU(Central Processing Unit)是指中央處理器,它與GPU的核心差異在于架構(gòu)設(shè)計(jì):CPU通常擁有少數(shù)幾個(gè)強(qiáng)大的核心,擅長(zhǎng)處理復(fù)雜的通用串行任務(wù),如同一位能解奧數(shù)題的中學(xué)生;而GPU則集成數(shù)千個(gè)相對(duì)簡(jiǎn)單的核心,專(zhuān)為處理海量同質(zhì)化的并行任務(wù)而生,好比幾百個(gè)小學(xué)生協(xié)作完成數(shù)萬(wàn)道加減法。

圖片

圖:GPU在計(jì)算機(jī)中的位置,公開(kāi)資料整理。

如果說(shuō)CPU是計(jì)算機(jī)的"大腦",負(fù)責(zé)決策與控制,那么GPU則是專(zhuān)精于"大規(guī)模重復(fù)勞動(dòng)"的"肌肉",其并行計(jì)算的天性,使其在圖形渲染和高效能矩陣運(yùn)算(人工智能的核心)中的效率遠(yuǎn)超CPU。

隨著5G與人工智能時(shí)代的到來(lái),數(shù)據(jù)中心內(nèi)機(jī)器學(xué)習(xí)等AI計(jì)算已占據(jù)總計(jì)算量的四分之一到三分之一,大數(shù)據(jù)處理的重任正從CPU向算力更強(qiáng)的GPU轉(zhuǎn)移。GPU的應(yīng)用早已超越傳統(tǒng)的個(gè)人電腦圖形顯示,其形態(tài)按接入方式可分為獨(dú)立與集成;其疆域已擴(kuò)展至移動(dòng)設(shè)備、數(shù)據(jù)中心服務(wù)器與個(gè)人電腦等多個(gè)場(chǎng)景。尤其在AI與云計(jì)算浪潮下,GPU憑借其與生俱來(lái)的并行計(jì)算優(yōu)勢(shì),成為了數(shù)據(jù)處理的核心引擎,開(kāi)辟出一個(gè)規(guī)?涨暗脑鲩L(zhǎng)市場(chǎng)。盡管FPGA和ASIC等更為專(zhuān)用的計(jì)算芯片也在特定領(lǐng)域嶄露頭角,但行業(yè)共識(shí)在于,GPU憑借其卓越的通用性、成熟的軟件生態(tài)(尤其是英偉達(dá)的CUDA)及強(qiáng)大的綜合算力表現(xiàn),仍是當(dāng)前AI計(jì)算領(lǐng)域無(wú)可爭(zhēng)議的霸主與主導(dǎo)架構(gòu)。

這一定位,是理解其萬(wàn)億級(jí)產(chǎn)業(yè)價(jià)值的邏輯起點(diǎn)。

02

GPU從哪來(lái):一部從游戲顯卡到AI基石的創(chuàng)業(yè)史

GPU產(chǎn)業(yè)的崛起,是一部典型的硅谷技術(shù)創(chuàng)業(yè)史詩(shī),而其主角無(wú)疑是英偉達(dá)(NVIDIA)。故事的開(kāi)端可追溯至1989年——幾位工程師共同勾勒了一款新圖形加速器的藍(lán)圖。1993年,英偉達(dá)正式成立,開(kāi)始的創(chuàng)業(yè)之路充滿坎坷,至1995年,公司面臨設(shè)計(jì)出芯片卻無(wú)資金建廠制造的困境。創(chuàng)始人黃仁勛致信臺(tái)積電創(chuàng)始人張忠謀求助,并成功獲得支持。

這段合作被黃仁勛本人視為關(guān)鍵轉(zhuǎn)折:"如果當(dāng)初我自己建廠生產(chǎn)GPU芯片,我現(xiàn)在可能就是一個(gè)守著幾千萬(wàn)美元的公司的安逸的CEO。"臺(tái)積電的代工模式讓英偉達(dá)得以輕資產(chǎn)運(yùn)營(yíng),聚焦設(shè)計(jì)與創(chuàng)新,從而快速迭代產(chǎn)品,搶占市場(chǎng)。

1999年,英偉達(dá)做出了兩個(gè)定義行業(yè)的舉動(dòng):一是徹底轉(zhuǎn)型專(zhuān)注于顯卡芯片,二是首次在全球提出"GPU"這一革命性概念(但在提出這個(gè)概念以后的相當(dāng)一段時(shí)間內(nèi),GPU還僅僅用于圖形處理,遠(yuǎn)不像現(xiàn)在這般如雷貫耳)。同年,公司在納斯達(dá)克上市,市值達(dá)6.26億美元,開(kāi)啟了長(zhǎng)達(dá)二十余年的高速增長(zhǎng)傳奇。

然而,硬件性能的領(lǐng)先并非其構(gòu)筑護(hù)城河的終極武器。真正的"神來(lái)之筆"發(fā)生在2006年,英偉達(dá)在推出新一代GPU的同時(shí),發(fā)布了具有劃時(shí)代意義的CUDA計(jì)算平臺(tái)。CUDA即Compute Unified Device Architecture,統(tǒng)一計(jì)算架構(gòu),本質(zhì)上是一套軟件工具,它讓開(kāi)發(fā)者能夠以前所未有的便捷性,調(diào)用GPU的強(qiáng)大算力進(jìn)行通用計(jì)算(GPGPU),這為后來(lái)深度學(xué)習(xí)的爆發(fā)埋下了伏筆。

起初,CUDA的商業(yè)價(jià)值并未被市場(chǎng)立刻接受。但英偉達(dá)展現(xiàn)出了驚人的戰(zhàn)略耐心與遠(yuǎn)見(jiàn):向全球高校和研究所免費(fèi)開(kāi)放并設(shè)立研發(fā)中心;以資金扶持創(chuàng)業(yè)公司使用;持續(xù)開(kāi)源核心軟件庫(kù);甚至確保廉價(jià)的消費(fèi)級(jí)游戲顯卡也支持CUDA,將開(kāi)發(fā)門(mén)檻降至千元級(jí)別。

經(jīng)過(guò)十余年不計(jì)短期回報(bào)的持續(xù)灌溉,CUDA逐漸從一款開(kāi)發(fā)工具,演進(jìn)為高端計(jì)算與圖形領(lǐng)域的事實(shí)標(biāo)準(zhǔn),構(gòu)筑了堪比操作系統(tǒng)般的深厚生態(tài)壁壘。即便競(jìng)爭(zhēng)對(duì)手的GPU硬件性能參數(shù)相近,但在AI開(kāi)發(fā)社區(qū)的受歡迎程度卻有天壤之別,核心差距就在于CUDA所帶來(lái)的開(kāi)發(fā)效率與計(jì)算效能倍增。

圖片

圖:關(guān)于CUDA的描述,來(lái)自英偉達(dá)官網(wǎng)

直到2014年前后,英偉達(dá)將CUDA與AI計(jì)算完美融合,英偉達(dá)的騰飛才真正開(kāi)始。如今,CUDA連接了全球數(shù)百萬(wàn)開(kāi)發(fā)者,使英偉達(dá)GPU成為AI時(shí)代事實(shí)上的"計(jì)算貨幣",其護(hù)城河之深,已難以用單純的晶體管數(shù)量或浮點(diǎn)算力來(lái)衡量。這也能說(shuō)明為何國(guó)產(chǎn)GPU公司很難實(shí)現(xiàn)快速超車(chē)。

03

技術(shù)爭(zhēng)鋒:HBM、架構(gòu)迭代與性能軍備競(jìng)賽

驅(qū)動(dòng)GPU產(chǎn)業(yè)以"黃氏定律"速度(顯示芯片性能每6個(gè)月提升1倍,AI算力在8年內(nèi)實(shí)現(xiàn)千倍增長(zhǎng))前進(jìn)的,是持續(xù)不斷的技術(shù)創(chuàng)新與白熱化的性能軍備競(jìng)賽。筆者梳理發(fā)現(xiàn),當(dāng)前的技術(shù)角逐主要集中在3個(gè)關(guān)鍵維度:

1、存儲(chǔ)技術(shù)的躍遷

算力的爆炸式增長(zhǎng),不僅需要強(qiáng)大的"引擎"(GPU核心),更依賴于能夠?qū)崟r(shí)"喂飽"引擎數(shù)據(jù)的"高速糧道"。自2017年起,英偉達(dá)便在高端AIGPU(如A100、H100)中率先采用HBM(高頻寬存儲(chǔ)器)技術(shù)。

這與傳統(tǒng)的GDDR(Graphics Double Data Rate)內(nèi)存有本質(zhì)不同:GDDR作為傳統(tǒng)的內(nèi)存技術(shù),提供了平衡的性能和成本,適用于廣泛的圖形應(yīng)用,而HBM則更專(zhuān)注于提供高性能、高帶寬以及更能效的解決方案,適用于對(duì)數(shù)據(jù)傳輸速度和能效要求更高的領(lǐng)域。在結(jié)構(gòu)上,GDDR是一種傳統(tǒng)的圖形內(nèi)存,通常以單個(gè)芯片的形式存在,它的設(shè)計(jì)比較扁平,內(nèi)存芯片以并行方式連接到圖形處理單元(GPU)。HBM通過(guò)3D堆疊、硅通孔(TSV)等尖端封裝工藝,將多層DRAM芯片像蓋樓一樣垂直堆疊,并與GPU邏輯芯片通過(guò)硅中介層緊密集成。這種設(shè)計(jì)帶來(lái)了革命性優(yōu)勢(shì):HBM擁有數(shù)倍于GDDR的帶寬和更低的功耗,但代價(jià)是結(jié)構(gòu)極度復(fù)雜、成本高昂。

圖片

圖:H200,英偉達(dá)官網(wǎng)

以英偉達(dá)2023年底發(fā)布的H200 GPU為例,它首次搭載HBM3e,顯存帶寬高達(dá)4.8TB/秒,用于700億參數(shù)大模型推理時(shí),速度是前代H100的1.9倍,能耗卻降低一半。這清晰表明,突破"內(nèi)存墻"是算力持續(xù)進(jìn)化的生死線。

2、架構(gòu)平臺(tái)的高速代際飛躍

GPU行業(yè)中,很多企業(yè)把英偉達(dá)當(dāng)成終極目標(biāo),但筆者看來(lái),一個(gè)殘酷的事實(shí)是,這個(gè)終極目標(biāo)并非原地不動(dòng)等待超越,而是仍在向前狂奔,保持著約兩年一次架構(gòu)升級(jí)的殘酷節(jié)奏。其下一代平臺(tái)"Rubin"已提上日程,計(jì)劃于2026年量產(chǎn)。Rubin不再僅僅是單一的GPU芯片,而是一個(gè)整合了Rubin GPU、專(zhuān)為AI推理設(shè)計(jì)的Vera CPU、新一代NV Link交換機(jī)芯片、高速網(wǎng)卡的龐大計(jì)算系統(tǒng)。其中,Rubin GPU的關(guān)鍵指標(biāo)呈現(xiàn)跨代躍升:FP4推理性能預(yù)計(jì)達(dá)到當(dāng)前Blackwell架構(gòu)的5倍。這場(chǎng)競(jìng)爭(zhēng)已從單一的"芯片對(duì)決"升級(jí)為"系統(tǒng)平臺(tái)戰(zhàn)爭(zhēng)",比拼的是從芯片到集群的全棧優(yōu)化能力。

3、圖形與計(jì)算的雙重挑戰(zhàn)

盡管AI計(jì)算是當(dāng)前最大的風(fēng)口,但圖形顯示功能本身的技術(shù)壁壘實(shí)際上更為森嚴(yán)。硬件結(jié)構(gòu)上,一顆完整的GPU需要集成光柵化、紋理貼圖、光線追蹤等為圖形專(zhuān)門(mén)優(yōu)化的硬件單元,其復(fù)雜程度遠(yuǎn)超專(zhuān)注于矩陣計(jì)算的AI芯片;算法上,圖形處理涉及計(jì)算機(jī)圖形學(xué),需要融合物理模擬、光學(xué)渲染等多學(xué)科知識(shí),算法難度極高。

因此,能夠同時(shí)駕馭高性能圖形渲染與通用AI計(jì)算的"全功能GPU",代表了芯片設(shè)計(jì)領(lǐng)域的皇冠明珠,這也是諸多國(guó)產(chǎn)GPU廠商將"全功能"作為核心戰(zhàn)略方向的原因。

當(dāng)國(guó)際巨頭在技術(shù)前沿高歌猛進(jìn),用一代代產(chǎn)品定義著算力標(biāo)準(zhǔn)時(shí),一個(gè)關(guān)鍵問(wèn)題擺在全球產(chǎn)業(yè)面前:在這條被巨頭劃定的賽道上,后來(lái)者還有機(jī)會(huì)嗎?中國(guó)的答案,正在上海張江的實(shí)驗(yàn)室里、在資本市場(chǎng)的鑼聲中、在一張張累計(jì)虧損數(shù)十億的財(cái)務(wù)報(bào)表背后,悄然書(shū)寫(xiě)。從技術(shù)追隨到生態(tài)破局,國(guó)產(chǎn)GPU的征途,遠(yuǎn)比想象中更加艱難,也更加波瀾壯闊,我們下篇繼續(xù)分析。

       原文標(biāo)題 : 算力競(jìng)速(上):GPU如何蛻變?yōu)锳I時(shí)代的新石油

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)