H20獲得“口頭放行”之后,英偉達(dá)需要重新認(rèn)識中國市場

經(jīng)濟(jì)觀察報(bào) 關(guān)注 2025-07-15 15:01

經(jīng)濟(jì)觀察報(bào)記者 鄭晨燁

7月15日,英偉達(dá)(NVIDIA)創(chuàng)始人兼CEO黃仁勛現(xiàn)身北京參加第三屆中國國際供應(yīng)鏈促進(jìn)博覽會。這已是黃仁勛在2025年內(nèi)第三次到訪中國大陸,就在幾天前的7月9日,他執(zhí)掌的英偉達(dá),市值盤中突破4萬億美元大關(guān)。

同日,根據(jù)英偉達(dá)官方微信公眾號發(fā)布的信息,英偉達(dá)正在提交重新銷售NVIDIA H20 GPU 的申請,“美國政府已向英偉達(dá)保證將授予許可證”,并且英偉達(dá)希望盡快啟動交付。H20是英偉達(dá)此前“特供”中國市場的一款A(yù)I芯片,今年4月被美國政府列入出口管制。

英偉達(dá)在文中同時(shí)強(qiáng)調(diào)了其在美國“加強(qiáng)AI基礎(chǔ)設(shè)施”的努力,以及在中國“探討AI如何提高生產(chǎn)力”的意愿。

為“合規(guī)”而生的H20

H20芯片的誕生背景,可直接追溯至2023年10月17日。

彼時(shí),美國商務(wù)部工業(yè)與安全局(BIS)發(fā)布了更新的出口管制最終規(guī)則,該規(guī)則對銷往中國的先進(jìn)計(jì)算芯片,設(shè)置了兩道核心的、量化的技術(shù)紅線。第一道紅線是“總體處理性能”,用以衡量芯片的綜合原始算力;第二道紅線則是“性能密度”,即總體處理性能與芯片面積的比值,旨在限制通過芯粒(Chiplet)組合方式繞開管制的能力。

這兩項(xiàng)指標(biāo)的設(shè)定,將英偉達(dá)當(dāng)時(shí)最暢銷的H100、A100以及H800、A800等數(shù)據(jù)中心GPU產(chǎn)品,擋在了中國市場門外。

作為應(yīng)對,英偉達(dá)迅速調(diào)整其產(chǎn)品策略。2023年11月,根據(jù)公開報(bào)道,英偉達(dá)已開發(fā)出三款專為中國市場設(shè)計(jì)的新芯片——H20、L20和L2,其核心設(shè)計(jì)目標(biāo),就是嚴(yán)格遵照BIS設(shè)定的技術(shù)參數(shù)框架,確保產(chǎn)品合規(guī)。其中,作為面向AI訓(xùn)練任務(wù)的旗艦型號,H20的公開規(guī)格參數(shù),清晰地反映了這種“合規(guī)”的內(nèi)在邏輯,它與被禁售的H100同樣基于Hopper架構(gòu)(英偉達(dá)推出的一種GPU架構(gòu)),但在關(guān)鍵性能上進(jìn)行了精確的調(diào)整。

在算力性能方面,H20的FP16/BF16(半精度浮點(diǎn))算力為148 TFLOPS(每秒萬億次浮點(diǎn)運(yùn)算)。作為對比,被限制的H100芯片在同等精度(FP16)下的算力高達(dá)1979 TFLOPS。盡管性能差距顯著,H20的總體處理性能(TPP)經(jīng)計(jì)算后低于美國商務(wù)部工業(yè)與安全局(BIS)設(shè)定的4800 TPP管制紅線,從而達(dá)到了“合規(guī)”標(biāo)準(zhǔn)。

顯存配置是H20少數(shù)未被削減的環(huán)節(jié),其HBM3顯存容量從H100的80GB增至96GB,顯存帶寬也由3.35 TB/s提升到4.0 TB/s。芯片間的互聯(lián)性能,則是H20最受關(guān)注的環(huán)節(jié)之一,其單卡NVLink(英偉達(dá)開發(fā)的一種高速互連技術(shù))互聯(lián)總帶寬為900 GB/s,與H100的規(guī)格持平,這保證了服務(wù)器節(jié)點(diǎn)內(nèi)部的GPU間通信效率。

然而,真正的瓶頸在于跨節(jié)點(diǎn)的集群互聯(lián)能力,由于美國對高速網(wǎng)絡(luò)設(shè)備同樣存在出口管制,中國客戶將難以獲得用于構(gòu)建DGX SuperPOD級別集群的NVIDIA Quantum-2 InfiniBand網(wǎng)絡(luò)方案——該方案能為每個(gè)服務(wù)器節(jié)點(diǎn)提供高達(dá)400 GB/s(即3.2 Tb/s)的外部互聯(lián)帶寬。

對于需要數(shù)千顆GPU互聯(lián)以訓(xùn)練大模型的中國云廠商而言,外部互聯(lián)能力的缺失,意味著組建超大規(guī)模集群的通信效率將大打折扣,難度與成本也隨之顯著增加。

從產(chǎn)品立項(xiàng)到正式獲得銷售許可,H20的問世之路并不平坦,該芯片原定于2024年初上市,但其面市時(shí)間一再推遲,市場普遍認(rèn)為,延遲的原因在于該系列芯片需通過美國政府的額外審核程序。這漫長的等待,直至2025年7月15日英偉達(dá)官方宣布獲得“保證”,才算告一段落。

“保證”之下的市場挑戰(zhàn)

英偉達(dá)官方信息中“保證將授予許可證”的表述,在商業(yè)層面意義重大,它為英偉達(dá)在中國市場啟動一系列商業(yè)活動提供了必要的基礎(chǔ),這意味著,英偉達(dá)可以正式與中國客戶就H20的銷售進(jìn)行談判、簽署意向訂單、進(jìn)行產(chǎn)能規(guī)劃和供應(yīng)鏈準(zhǔn)備。

與此同時(shí),英偉達(dá)也亮出了其多產(chǎn)品策略的另一環(huán)。英偉達(dá)在官方公眾號的文章中同時(shí)宣布,將推出一款“全新且完全兼容”的NVIDIA RTX PRO GPU,該產(chǎn)品“是為智能工廠和物流打造數(shù)字孿生AI的理想選擇”。

在高性能計(jì)算芯片受限的背景下,轉(zhuǎn)向工業(yè)AI應(yīng)用領(lǐng)域,不僅符合中國推動制造業(yè)升級和“新質(zhì)生產(chǎn)力”發(fā)展的宏觀政策方向,也因其應(yīng)用場景的特殊性,面臨相對較低的出口管制風(fēng)險(xiǎn)。數(shù)字孿生、工業(yè)自動化等市場,或?qū)⒊蔀橛ミ_(dá)在中國尋求更穩(wěn)固業(yè)務(wù)的突破口。

然而,無論是H20的“有條件回歸”,還是RTX PRO的“新路開拓”,都無法回避一個(gè)已然改變的市場現(xiàn)實(shí)——激烈的本土競爭。

在美國出口管制政策的窗口期內(nèi),中國本土AI芯片產(chǎn)業(yè)獲得了加速發(fā)展的空間。

最直接的體現(xiàn)是市場份額的變化。根據(jù)TrendForce集邦咨詢2025年5月發(fā)布的一份研究報(bào)告,中國AI服務(wù)器市場預(yù)計(jì)外購英偉達(dá)、AMD等芯片比例會從2024年約63%下降至2025年約42%,而中國本土芯片供應(yīng)商在國有AI芯片政策支持下,預(yù)期2025年占比將提升至40%,幾乎與外購芯片比例平分秋色。

另根據(jù)國際數(shù)據(jù)公司(IDC)發(fā)布的《中國半年度加速計(jì)算市場(2024上半年)跟蹤》報(bào)告,2024年上半年,中國加速服務(wù)器市場規(guī)模達(dá)到50億美元,同比2023上半年增長63%。在這一高速增長的市場中,一個(gè)關(guān)鍵的變化是,由NPU、ASIC等非GPU芯片驅(qū)動的加速服務(wù)器市場規(guī)模增速高達(dá)182%,達(dá)到近7億美元。

從更底層的加速芯片角度看,這一趨勢同樣顯著。IDC數(shù)據(jù)顯示,2024上半年,中國加速芯片的市場總規(guī)模超過90萬張,其中,中國本土人工智能芯片品牌的出貨量已接近20萬張,約占整個(gè)市場份額的20%。

值得注意的是,在服務(wù)器廠商層面,2024上半年按銷售額計(jì)算,浪潮、新華三、寧暢等本土廠商占據(jù)了市場超過70%的份額,中國本土的服務(wù)器供應(yīng)鏈正在與國產(chǎn)AI芯片加速深度綁定,構(gòu)建起相對獨(dú)立的生態(tài)系統(tǒng)。

IDC中國AI基礎(chǔ)架構(gòu)分析師杜昀龍?jiān)趫?bào)告中認(rèn)為,由于前期的大量采購,目前中國的AI服務(wù)器市場仍處于“存量市場”狀態(tài),這為本土技術(shù)的升級提供了一定的“緩沖期”。他亦指出,在當(dāng)前環(huán)境下,隨著行業(yè)大模型需求的不斷加深,“適配中國算力設(shè)施的生態(tài)建設(shè)將成為主要的著力點(diǎn)”。

一個(gè)標(biāo)志性的商業(yè)案例,則更直觀地反映了本土AI芯片產(chǎn)業(yè)加速發(fā)展的趨勢。2024年5月,中國移動公示了其《2024年至2025年新型智算中心采購》項(xiàng)目的中標(biāo)結(jié)果,該項(xiàng)目共計(jì)采購人工智能服務(wù)器7994臺,總金額高達(dá)191億元人民幣(不含稅)。根據(jù)公開的中標(biāo)信息,分享這一大單的服務(wù)器廠商包括昆侖、中科可控、寶德、長江計(jì)算、超聚變、百信、華鯤振宇等。一個(gè)關(guān)鍵的細(xì)節(jié)是,這七家中標(biāo)廠商,均為華為昇騰生態(tài)體系內(nèi)的硬件合作伙伴,此次招標(biāo)的技術(shù)路線幾乎被昇騰體系“全包”。

在市場需求最旺盛的互聯(lián)網(wǎng)行業(yè),頭部云廠商也均用實(shí)際行動完成了對國產(chǎn)化AI基礎(chǔ)設(shè)施的布局。根據(jù)華為昇騰官方公布的信息,其AI硬件平臺已對阿里巴巴的全系列“通義千問”大模型——從70億參數(shù)的Qwen-7B到千億參數(shù)的Qwen-72B——實(shí)現(xiàn)了全面適配與深度優(yōu)化;百度智能云通過其“千帆”大模型平臺,為用戶提供了將文心大模型一鍵部署至?xí)N騰硬件的選項(xiàng);騰訊云也已將其“混元”大模型與昇騰服務(wù)器相結(jié)合,面向政企客戶推出解決方案;科大訊飛的“星火”大模型更是最早完成與昇騰平臺適配的企業(yè)之一。

也就是說,英偉達(dá)“H20”此次重返市場,面對的已不再是一個(gè)對其高度依賴的空白地帶,它不僅需要向客戶解釋其“合規(guī)”后性能參數(shù)的削減,更需要面對在價(jià)格、服務(wù)以及生態(tài)協(xié)同上都極具優(yōu)勢的本土競爭者。

此外,對于已經(jīng)投入大量資源進(jìn)行國產(chǎn)化AI基礎(chǔ)設(shè)施適配與軟件生態(tài)建設(shè)的中國客戶而言,是否愿意以及在多大程度上“重返”英偉達(dá)的技術(shù)體系,也將是一個(gè)復(fù)雜且艱難的商業(yè)決策。

免責(zé)聲明:本文觀點(diǎn)僅代表作者本人,供參考、交流,不構(gòu)成任何建議。
深圳采訪部記者 關(guān)注新能源、半導(dǎo)體、智能汽車等新產(chǎn)業(yè)領(lǐng)域,有線索歡迎聯(lián)系:zhengchenye@eeo.com.cn,微信:zcy096x。

熱新聞