遠水難解近渴!英偉達緊急向臺積電訂購30萬顆H20芯片
關鍵詞: H20芯片 出口限制 供需失衡 國產(chǎn)AI芯片 CUDA生態(tài)
在放開出口限制之后,H20這一AI芯片在中國市場出現(xiàn)了供不應求的現(xiàn)象。
7月29日,據(jù)路透社援引兩位消息人士報道,英偉達已向臺積電下達了30萬片H20芯片組的訂單。其中一位消息人士指出,強勁的中國需求促使英偉達改變主意,不再僅僅依賴現(xiàn)有庫存。
據(jù)行業(yè)分析機構(gòu)Jefferies估算,中國市場對H20級別AI芯片的總需求量約為180萬顆 。然而,在2025年早些時候,英偉達的H20芯片庫存據(jù)估計僅在60萬至90萬顆之間 。這一巨大的供需失衡是缺口存在的根本原因。
值得一提的是,中國科技巨頭早在2024年就已下達了價值超過120億美元的H20芯片預訂單,以鎖定未來供應。然而,今年4月美國政府一張出口限制令,讓這一芯片在華銷售一度停滯。但在7月,這一出口限制令的突然反轉(zhuǎn),進一步加劇了H20芯片的供應偏緊的現(xiàn)狀。
美國出口管制政策的反復與不確定性
實際上,H20并非一款常規(guī)迭代的產(chǎn)品,而是地緣政治影響下的特定產(chǎn)物。
H20基于成熟的NVIDIA Hopper架構(gòu),采用臺積電N4工藝及CoWoS先進封裝技術,內(nèi)部集成超過800億個晶體管 。部分信息顯示其芯片本體是GH100的削減版本 。
該芯片配備了高達96GB的HBM3高帶寬內(nèi)存,顯存帶寬達到4.0 TB/s 。這一內(nèi)存在容量上與旗艦級的H100/H200保持一致,成為其在處理大型語言模型(LLM)時的關鍵優(yōu)勢之一。但H20的算力被精確地限制在美方規(guī)定的性能密度門檻之下,綜合算力大約只有H100的20%,在關鍵的FP16性能上,僅為H100的1/6到1/15 。
H20的市場定位非常明確:在美國先進AI芯片被禁運的背景下,為中國大陸的科技企業(yè)提供一個性能尚可、能夠合法獲得且兼容現(xiàn)有CUDA生態(tài)系統(tǒng)的高性能計算解決方案 。其主要應用場景覆蓋了AI推理、大模型訓練、高性能計算(HPC)、云計算及數(shù)據(jù)中心等領域 。
2025年4月,美國政府更新了出口管制清單,對H20芯片實施了新的出口許可要求,一度導致其對華銷售陷入停滯 。
由于4月份的出口禁令,英偉達在2026財年第一季度(截至2025年5月)財報中計提了高達45億至55億美元的庫存減值和采購承諾相關費用 這凸顯了政策不確定性給企業(yè)帶來的巨大經(jīng)營風險,也使得英偉達在重啟生產(chǎn)決策上更為謹慎。而英偉達為規(guī)避風險,已主動取消了在臺積電預訂的部分H20生產(chǎn)產(chǎn)能 。
2025年7月中旬,英偉達CEO黃仁勛宣布已獲美國政府批準,可以恢復向中國市場發(fā)貨H20芯片 。這一消息瞬間引爆了積壓已久的市場需求,但由于生產(chǎn)線早已調(diào)整,供應鏈無法立即響應。
緊急追加30萬顆訂單也難解“近渴”
美國政府的出口管制政策具有高度不確定性,而半導體供應鏈的調(diào)整卻需要漫長而穩(wěn)定的周期。這種錯配導致了市場的劇烈波動和供應的持續(xù)緊張。
目前,H20的主要客戶群體非常集中,即中國大陸的頭部互聯(lián)網(wǎng)和云計算公司,包括但不限于阿里巴巴、騰訊、字節(jié)跳動和百度等 。這些公司在2024年已大量下單,是此次供應缺口中最主要的“需求方”。
Jefferies的分析認為,英偉達在2025年第一季度向中國出貨了約30萬顆H20 GPU。隨著7月恢復銷售許可,市場預計英偉達將首先清理其60-90萬顆的現(xiàn)有庫存。有分析指出,恢復出貨后,庫存去化速度可提升30% 。
7月下旬援引知情人士消息稱,英偉達為補充其60-70萬顆的現(xiàn)有庫存,已向臺積電下達了30萬片H20芯片的新訂單,標志著其決定重啟為中國市場的定制芯片生產(chǎn)線 。
不過,即便英偉達下單意愿強烈,臺積電的接單能力也面臨巨大挑戰(zhàn)。臺積電方面表示,如果從零開始重啟H20的供應鏈,整個過程可能需要長達九個月的時間 。
據(jù)悉,臺積電的N4產(chǎn)線持續(xù)滿載,幾乎沒有空間處理緊急訂單 。重新調(diào)整生產(chǎn)計劃會影響對其他重要客戶(如蘋果、AMD等)的承諾,機會成本極高。
基于N4工藝的芯片從投片到最終封裝測試完成,生產(chǎn)周期約為3個月 。結(jié)合前述9個月的供應鏈重啟時間,即便訂單此刻確認,終端用戶最快也要等到2026年年中才能拿到這批新芯片。顯然,這“遠水”解不了中國大陸客戶的“近渴”。
為何國產(chǎn)AI芯片難以替代H20芯片
在未來數(shù)月內(nèi),中國大陸市場將主要依賴消化英偉達現(xiàn)有的H20庫存。價格可能因供不應求而保持高位。那么,為何國產(chǎn)AI芯片難以替代英偉達H20芯片?
首先,全球超90%的AI模型基于英偉達CUDA平臺開發(fā),遷移至國產(chǎn)框架需重寫30%以上代碼,耗時6個月以上,并承擔技術風險。而且,TensorFlow、PyTorch等主流框架對CUDA深度優(yōu)化,而國產(chǎn)芯片需額外適配層,增加延遲和開發(fā)成本。
其次,H20雖FP16性能僅達H100的28%,但其96GB HBM3顯存和4TB/s帶寬可滿足中等規(guī)模模型推理需求,如DeepSeek-R1的私有化推理顯存利用率達90%以上。對于地方政府、金融機構(gòu)及車企的垂類模型部署,H20的“及格線”性能已足夠。
此外,H20還有集群擴展性優(yōu)勢。該芯片支持8卡NVLink互聯(lián),顯存池化達768GB,可全量訓練70B參數(shù)模型;而國產(chǎn)芯片雖FP16算力接近H20,但在多卡互聯(lián)和混合精度訓練等場景仍存差距。
特別值得一提的是,H20通過調(diào)整算力密度、禁用關鍵張量核心等技術手段,勉強符合美國出口管制要求,同時保留Hopper架構(gòu)和CoWoS封裝技術,形成獨特市場定位。比如,該芯片顯存帶寬被刻意維持在900GB/s,正好卡在國產(chǎn)芯片與自身旗艦產(chǎn)品(H100的2TB/s)之間。這簡直是英偉達對美國出口管制的“精準閹割”。
還有最重要的采購成本問題。H20的定價(6500-8000美元)堪稱教科書級博弈,直接錨定華為昇騰910B政府采購價(6000美元)上浮20%,加上遷移成本和生態(tài)適應風險,制造“性價比幻覺”。
盡管此前國家發(fā)改委要求新建/擴建數(shù)據(jù)中心必須采用符合嚴格能效標準的AI芯片,直指H20的能效短板,但短期內(nèi)H20仍能通過“性能妥協(xié)+生態(tài)霸權(quán)”維持市場韌性。當前,國產(chǎn)AI芯片處于從“能用”到“敢不用”的臨界點,還需持續(xù)技術創(chuàng)新,以及政策支持和生態(tài)構(gòu)建,以在更多應用場景中實現(xiàn)替代。