訂閱
糾錯
加入自媒體

寒武紀(jì)的“榜一大哥”,字節(jié)跳動不想當(dāng)了

2026-02-25 11:15
超聚焦
關(guān)注

第三方芯片廠商進入“倒計時”

為了把利潤留在自己鍋里,字節(jié)選擇下場造芯。

近日,據(jù)藍鯨科技報道,字節(jié)跳動芯片研發(fā)團隊將開始規(guī);衅福唧w招聘城市涵蓋北京、上海、深圳等,所需職位包括芯片架構(gòu)、soc設(shè)計等。

該知情人士透露,字節(jié)跳動芯片研發(fā)團隊目前核心集中于芯片設(shè)計環(huán)節(jié),圍繞公司自身業(yè)務(wù)開展專用硬件定制與優(yōu)化,面向云端場景研發(fā)多款采用先進半導(dǎo)體工藝的復(fù)雜芯片,以提升性能、降低算力成本。

“目前字節(jié)芯片團隊已實現(xiàn)多次一版成功流片,早期多個項目進入量產(chǎn)部署階段,覆蓋多個主流先進工藝節(jié)點,整體研發(fā)與落地節(jié)奏穩(wěn)步推進!

而在團隊規(guī)模上面,據(jù)雷達Finance報道,字節(jié)的AI芯片團隊和CPU團隊人數(shù)較多,其中,AI芯片方向人數(shù)過半,達500人以上,CPU團隊在200人左右。

然而,千人團隊的集結(jié)僅僅是一個開始,真正的博弈才剛剛拉開序幕。

面對日益增長的AI投入,自研芯片能否幫助字節(jié)跳動徹底擺脫“給英偉達打工”的魔咒,將昂貴的算力成本轉(zhuǎn)化為火山引擎的獨家利潤?又能否復(fù)刻谷歌TPU的神話,利用極致的軟硬協(xié)同重新定義MaaS市場的定價權(quán)?

而對于寒武紀(jì)等剛剛盈利的國產(chǎn)芯片廠商而言,大廠的每一次流片成功,究竟是市場繁榮的信號,還是那個殘酷的“去中介化”倒計時?

01

昂貴的“過路費”

字節(jié)不得不算的千億開支賬

自研芯片,是一筆不得不算的經(jīng)濟賬。

據(jù)金融時報報道,字節(jié)跳動2026年的資本開支擬達到約1600億元人民幣,高于2025年約1500億元人民幣的投入,其中約一半資金將用于采購先進半導(dǎo)體芯片以開發(fā)AI模型和應(yīng)用,而若獲準(zhǔn)采購更多先進芯片,還會進一步大幅增加資本開支。

如果倒退回五年前,用于AI芯片的這筆錢字節(jié)跳動花得起,也愿意花。

彼時,AI在字節(jié)的版圖中僅僅是一個“優(yōu)化項”,主要用于推薦算法的提效或廣告系統(tǒng)的精準(zhǔn)度提升。但隨著“豆包”大模型及豆包、即夢等AI應(yīng)用的全面爆發(fā),情況發(fā)生了根本性的逆轉(zhuǎn)。據(jù)QuestMobile數(shù)據(jù)顯示,豆包APP在2025年底的月活用戶已穩(wěn)居國內(nèi)AI類應(yīng)用榜首,且用戶時長呈指數(shù)級增長。

與此同時,作為字節(jié)跳動B端業(yè)務(wù)全新增長極的火山引擎,也在經(jīng)歷一場前所未有的算力饑渴。

在經(jīng)歷了將大模型價格打入“厘時代”的激進價格戰(zhàn)后,火山引擎通過極致性價比策略,正在將日均處理Token推向了百萬萬億級別。這種以價換量的策略雖然搶占了MaaS的市場份額,但也讓底層的算力承壓達到了臨界點,火山不僅要支撐內(nèi)部數(shù)億用戶的即時交互,還要響應(yīng)外部企業(yè)客戶海量的API調(diào)用。

于是,當(dāng)AI業(yè)務(wù)從“錦上添花”變成了公司的“核心增長極”,算力消耗的性質(zhì)也變了:它不再是研發(fā)投入,而是每一分鐘都在流血的運營成本。

當(dāng)數(shù)以十萬計的GPU在機房轟鳴,每一秒鐘流走的不僅是電費,更是被英偉達等上游硬件廠商切走的巨額利潤。對于擁有數(shù)億日活用戶的“豆包”和視頻生成模型而言,推理環(huán)節(jié)的算力消耗遠超訓(xùn)練環(huán)節(jié),這恰恰是成本失控的“重災(zāi)區(qū)”。

如果繼續(xù)依賴價格昂貴的通用GPU來處理海量的用戶請求,不僅意味著持續(xù)給供應(yīng)商“打工”,更意味著火山引擎在對外提供MaaS服務(wù)時,難以掌握定價的主動權(quán)。

這并非危言聳聽,看看供應(yīng)商的財報就知道“打工”打得有多慘烈。

在AI芯片的賣方市場里,定價權(quán)完全掌握在上游手中。據(jù)The Information分析,英偉達高端GPU的毛利率長期維持在70%以上的高位。對于字節(jié)跳動這樣千億級采購規(guī)模的超級大客戶來說,這意味著每花100塊錢買芯片,就有70塊錢是在給黃仁勛交“過路費”。

即便是在被視為“平替”的國產(chǎn)芯片領(lǐng)域,情況也并未好轉(zhuǎn)太多。以字節(jié)跳動核心供應(yīng)商之一的寒武紀(jì)為例,其2025年財報顯示,受益于互聯(lián)網(wǎng)大廠的瘋狂掃貨,公司不僅實現(xiàn)了歷史性盈利,其思元系列推理卡的毛利率也隨著規(guī)模效應(yīng)開始攀升,公司毛利率也超過50%。

于是,一個很殘酷但也很清晰的邏輯浮現(xiàn)了:上游芯片廠商的超額利潤,本質(zhì)上就是字節(jié)跳動和火山引擎的成本黑洞。

在存量競爭時代,供應(yīng)商的每一分利潤,都是字節(jié)可以挖掘的降本空間。既然推理芯片并不需要像訓(xùn)練芯片那樣追求極致的通用性和雙精度計算能力,那么為什么要把這幾百億的利潤拱手讓人?

更何況,在全球科技巨頭的牌桌上,“自研芯片”早已不是一道成本選擇題,而是一道能力證明題——證明你是否有資格成為真正的云巨頭。

放眼海外,谷歌早在十三年前就開啟了TPU的研發(fā)。而當(dāng)外界大力爭搶英偉達顯卡時,谷歌卻默默祭出了TPU。正是憑借TPU與TensorFlow框架的軟硬一體化,谷歌在保證自家搜索、YouTube推薦等龐大業(yè)務(wù)算力需求的同時,將單位算力成本壓縮到了競爭對手的幾分之一,甚至還開始了TPU的外售,扮演起了“第二英偉達”的角色。

目光轉(zhuǎn)回國內(nèi),阿里云走的也是自研的道路。

1月底,平頭哥官網(wǎng)上線了最新一代AI芯片“真武810E”,性能直接對標(biāo)海外芯片巨頭英偉達的H20,出貨量已達10萬片,超過寒武紀(jì),在國產(chǎn)GPU廠商中屬于第一梯隊。并在阿里云實現(xiàn)多個萬卡集群部署,并服務(wù)了國家電網(wǎng)、小鵬汽車等400多家客戶。

更重要的是,阿里云也借此實現(xiàn)了“平頭哥+阿里云+千問模型”黃金三角的閉環(huán)。

據(jù)雷峰網(wǎng)采訪的推理框架優(yōu)化專家張濤解析,“以DeepSeek推出大型MoE模型為例,其本質(zhì)便是在云端集群場景下實現(xiàn)了極致的模型與硬件的co-design,以此最大化釋放算力性能,而阿里的全棧自研將是更‘激進’的原生適配方案。”

對于字節(jié)跳動而言,前有谷歌TPU的“珠玉在前”,后有阿里PPU的“近身示范”,此時下場造芯,不僅是出于成本控制的防守,更是為了在MaaS戰(zhàn)爭中復(fù)刻谷歌神話的進攻。當(dāng)算力成本決定了模型定價的底線,沒有自研芯片的云廠商,注定只能是英偉達的“售票員”,永遠無法觸碰到商業(yè)閉環(huán)的核心利潤。

為了不當(dāng)這個“售票員”,字節(jié)跳動必須掌握這種“量體裁衣”的技術(shù)。

正如張濤所言,極對于互聯(lián)網(wǎng)企業(yè)來說,極致的Co-design才是破局關(guān)鍵。相比于采購?fù)ㄓ肎PU,自研的ASIC芯片更像是一把精準(zhǔn)的手術(shù)刀,它能針對字節(jié)獨有的推薦算法和Transformer架構(gòu)進行深度定制,剔除所有冗余的通用功能,把每一顆晶體管都用在刀刃上。

業(yè)界估算,這種極致的專用性,能將單位算力成本降低50%以上。這不僅僅是技術(shù)指標(biāo)的勝利,更是商業(yè)邏輯的質(zhì)變:當(dāng)采購規(guī)模突破了“自研盈虧平衡點”,下場造芯就從一種可有可無的技術(shù)儲備,變成了巨頭博弈中必須跨越的生存門檻。

只有把算力的“水龍頭”徹底掌握在自己手里,字節(jié)跳動才能在未來慘烈的模型價格戰(zhàn)中,擁有不用看別人臉色的底氣。

02

芯片“去中介化”

誰在寒冬里發(fā)抖?

然而,商業(yè)世界的甲之蜜糖,往往是乙之砒霜。

當(dāng)字節(jié)跳動決心將那幾百億的“超額利潤”留在自己鍋里時,對于剛剛在2025年嘗到甜頭的國產(chǎn)芯片廠商而言,這不僅僅意味著丟失了一個大客戶,更意味著一場關(guān)于“去中介化”的生命倒計時正式開啟。

回顧這段關(guān)系的起點,字節(jié)跳動與寒武紀(jì)的聯(lián)手,從一開始就帶有濃厚的“備胎”色彩。

如果將時間軸撥回兩年前,這是一場在極端外部壓力下的“抱團取暖”。彼時,受制于禁令因素,A100/H100軍無法正常供應(yīng),雖然隨后推出了H800、H20等“閹割版”的產(chǎn)品,但這把懸在頭頂?shù)倪_摩克利斯之劍讓所有互聯(lián)網(wǎng)巨頭都感到脊背發(fā)涼。在供應(yīng)鏈最黑暗的時刻,字節(jié)跳動急需一個“Plan B”來對沖英偉達隨時可能斷供的風(fēng)險。

而作為國產(chǎn)AI芯片“第一股”的寒武紀(jì),憑借其思元系列產(chǎn)品,成為了當(dāng)時為數(shù)不多能拿出量產(chǎn)現(xiàn)貨、且軟件棧相對成熟的供應(yīng)商。

這是一場典型的“基于恐懼的采購”,而非“基于性能的優(yōu)選”。

據(jù)產(chǎn)業(yè)鏈調(diào)研數(shù)據(jù)顯示,2023年至2024年間,字節(jié)跳動在瘋狂掃貨英偉達合規(guī)芯片的同時,開始向寒武紀(jì)下達了規(guī)?捎^的意向訂單。這些芯片并沒有立刻被部署在核心的推薦算法集群中,而是主要用于部分非核心業(yè)務(wù)的推理場景測試。

這種合作在2025年達到了頂峰:隨著字節(jié)AI產(chǎn)品爆發(fā),推理算力需求激增,而英偉達產(chǎn)能吃緊,寒武紀(jì)的思元590芯片成功切入了字節(jié)的供應(yīng)鏈體系,填補了部分算力缺口。

正是得益于字節(jié)跳動、百度、阿里等互聯(lián)網(wǎng)大廠的這種“避險性采購”,寒武紀(jì)迎來了它成立以來的最高光時刻。

2025年,寒武紀(jì)營收實現(xiàn)了驚人的翻倍式增長,一舉突破60億元人民幣大關(guān),同比增長率超過200%;更重要的是,它終于跨越了那道困擾了自身多年的財務(wù)天塹,實現(xiàn)了歷史性的首次年度盈利。

而在資本市場上,寒武紀(jì)的股價隨著這份“超預(yù)期”的成績單聞風(fēng)起舞。從2025年初開始,其股價猶如坐上了火箭,一路擊穿各大阻力位,市值一度逼近5000億大關(guān)。那段時間,券商研報都在用最亢奮的語調(diào)高呼“中國的英偉達已經(jīng)誕生”,科技股論壇都在討論思元系列如何在成為字節(jié)的“太子”,甚至還有字節(jié)入股寒武紀(jì)的小作文傳出。

投資者們篤定地認為,國產(chǎn)替代的終局已經(jīng)到來,寒武紀(jì)將像當(dāng)年的英偉達一樣,躺在互聯(lián)網(wǎng)巨頭的算力軍備競賽中,坐享高毛利的紅利。

然而,繁榮的表象之下,是極其脆弱的地基。

寒武紀(jì)的業(yè)績爆發(fā),本質(zhì)上是建立在“英偉達供給不足”和“巨頭自研尚未到位”這兩個時間差之上的。這是一種典型的“窗口期紅利”。對于字節(jié)跳動而言,2024年到2025年的大規(guī)模采購,更多是一場“基于恐懼的避險”和“不得不完成的任務(wù)”,而非基于技術(shù)與信任的合作。

產(chǎn)業(yè)鏈知情人士曾向超聚焦透露,字節(jié)跳動在彼時掃貨寒武紀(jì)思元590芯片,核心訴求非常簡單:填坑。 在英偉達高端算力受限、國產(chǎn)自研芯片尚未量產(chǎn)的空窗期,字節(jié)需要大量的現(xiàn)貨來維持“豆包”模型指數(shù)級增長的推理需求,并且作為互聯(lián)網(wǎng)第一大廠也有責(zé)任與義務(wù)扶持國產(chǎn)算力。

換句話說,大廠買你,不是因為你不可替代,而是因為當(dāng)時只有你“有貨”。

而當(dāng)時間來到2026年,當(dāng)字節(jié)跳動的1000人芯片團隊完成了從架構(gòu)設(shè)計到流片驗證的全部拼圖時,這個昂貴的“備胎”也將逐漸失去存在的意義。

寒武紀(jì)作為一家獨立的芯片設(shè)計公司,其產(chǎn)品迭代周期通常遵循傳統(tǒng)的硬件規(guī)律,一款芯片從定義到量產(chǎn)往往需要18到24個月。這意味著,當(dāng)字節(jié)跳動的算法團隊在2026年提出了一個新的稀疏化注意力機制時,他們?nèi)绻褂煤浼o(jì)的芯片,可能要等到2027年底才能用上硬件加速。

但在字節(jié)內(nèi)部,這個邏輯被徹底重寫了。

隨著“SeedChip”項目的落地,字節(jié)的算法團隊可以直接和芯片團隊坐在同一個辦公室里。這是一種物理距離歸零帶來的化學(xué)反應(yīng): 算法工程師上午提出的算子優(yōu)化需求,芯片架構(gòu)師下午就能將其寫入指令集,甚至直接調(diào)整片上內(nèi)存的配比。通過這種極致的Co-design,字節(jié)可以在幾個月內(nèi)實現(xiàn)硬件層面的迭代支持。

當(dāng)字節(jié)可以用更低的成本、更快的迭代速度來滿足自身需求時,繼續(xù)維持寒武紀(jì)的高毛利采購,就違背了商業(yè)的基本邏輯。

而這場危機,不僅僅屬于寒武紀(jì)。

目光放寬到整個國產(chǎn)芯片賽道,壁仞科技、摩爾線程等獨角獸公司,同樣面臨著被大廠“降維打擊”的風(fēng)險。這些公司的商業(yè)模式,在很大程度上都是試圖成為“中國的英偉達”,即通過設(shè)計通用的高性能GPU,賣給云廠商和智算中心。

但現(xiàn)實是,他們最大的潛在客戶阿里云、字節(jié)跳動、騰訊云、百度智能云,無一例外都在瘋狂布局自研芯片。

阿里的PPU已經(jīng)證明了這條路的可行性。其自研的AI芯片已經(jīng)在阿里內(nèi)部的推薦和推理業(yè)務(wù)中大面積鋪開,并且開始探索外售的道路。如果說阿里云是第一個吃螃蟹的人,那么字節(jié)跳動就是那個緊隨其后、且胃口更大的掠食者。

這便是“中間商”在巨頭博弈時代的宿命。

在云計算和AI的產(chǎn)業(yè)鏈條中,處于中游的第三方獨立芯片設(shè)計廠商,正面臨著前所未有的“夾層擠壓”。

向上,他們無法像英偉達那樣擁有無可撼動的CUDA生態(tài)護城河,能夠讓客戶“不得不買”;向下,他們又面臨著大廠自研芯片的極致性價比競爭。于是,當(dāng)最大的客戶變成了最強的競爭對手,第三方廠商的生存空間將被壓縮到極限。

未來,以字節(jié)、阿里為代表的互聯(lián)網(wǎng)巨頭,絕不會僅僅將自研芯片鎖在自家的機房里做“內(nèi)部特供”。商業(yè)的邏輯永遠是追求規(guī)模效應(yīng)的最大化:當(dāng)“SeedChip”或“真武”經(jīng)過了內(nèi)部數(shù)百萬卡級別的打磨驗證,良率穩(wěn)定、成本極低時,它們必然會走向?qū)ν馐圪u。

屆時,這些互聯(lián)網(wǎng)巨頭將完成最可怕的跨界:它們既是最大的云服務(wù)商,也是最大的芯片供應(yīng)商。而在這種降維打擊下,留給寒武紀(jì)等“特種生存派”的路,只剩下兩條。

第一條路是成為英偉達。

在這條路上,你要做的不僅僅是畫出最好的電路圖,而是要構(gòu)建出像CUDA一樣堅不可摧的軟件生態(tài)護城河。放眼全球,能走通這條路的獨立廠商只有英偉達一個,這需要“天時地利人和”的極致配合。

回顧英偉達的崛起,那是建立在長達15年的“孤獨長跑”之上的。黃仁勛在AI爆發(fā)前的荒原里,每年燒掉數(shù)億美金推廣CUDA,那時沒有巨頭盯著他,沒有云廠商搶他的生意,他擁有充足的時間窗口去“猥瑣發(fā)育”,將顯卡從游戲工具一點點改造成AI引擎。

但現(xiàn)在,這個“天時”已經(jīng)徹底消失了。

在AI已經(jīng)成為全球科技軍備競賽核心的今天,任何一家初創(chuàng)公司想要重走一遍CUDA之路,都會發(fā)現(xiàn)周圍早已是巨頭環(huán)伺。你沒有十年的時間去慢慢培養(yǎng)開發(fā)者生態(tài),因為字節(jié)和阿里們的自研芯片明天就會上線,直接用PyTorch/TensorFlow的底層適配繞過你的生態(tài)壁壘;你也沒有從容試錯的機會,因為資本市場和客戶不再相信長周期的神話。

這條路意味著要在巨頭的眼皮底下再造一個英偉達,但殘酷的是,這注定是一場九死一生的突圍。

第二條路,則是更現(xiàn)實的賣身互聯(lián)網(wǎng)。

對于大多數(shù)無法成為英偉達的國產(chǎn)芯片廠商而言,這或許是最好的歸宿。與其在巨頭的夾縫中被“去中介化”慢慢絞殺,不如在自己技術(shù)尚有價值、團隊尚有戰(zhàn)力的時候,選擇并入巨頭的版圖,融合成為字節(jié)或阿里內(nèi)部的一個硬件部門。這并非失敗,而是另一種形式的“上岸”。

對于寒武紀(jì)而言,2025年的盈利或許是短暫輝煌的起點,但也可能是大廠“去中介化”前最后的狂歡。

在這個贏家通吃的算力時代,單純的“硬件中間商”正在失去存在的土壤。未來的牌桌上,只有兩類玩家:要么強大到能像英偉達一樣,制定規(guī)則,讓巨頭為你打工; 要么,聰明到能像Annapurna一樣,融入巨頭,成為規(guī)則的一部分。

除此之外,已無更多坦途了。

- END -

       原文標(biāo)題 : 寒武紀(jì)的“榜一大哥”,字節(jié)跳動不想當(dāng)了

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號