曾經的對手,今日的盟友:重塑AI運算版圖
曾經的半導體巨頭英特爾(Intel)與繪圖晶片王者輝達(Nvidia)之間的激烈競爭,是業界數十年來的縮影。然而,在AI浪潮席捲全球的今日,這兩家曾經的勁敵卻選擇攜手合作,共同開創 AI基礎設施與個人運算的新篇章。這項令華爾街震驚的歷史性合作,不僅涉及輝達對英特爾的巨額投資,更將透過技術融合,重塑未來的運算版圖,並可能改變Nvidia在AI領域的「CUDA護城河」地位。
這項策略性聯盟的核心,是兩家公司意識到在日益複雜的AI軍備競賽中,單打獨鬥已難以維繫。輝達對英特爾的50億美元投資,以及雙方在資料中心和個人電腦領域的深度技術合作,預示著半導體產業一個新時代的來臨,強調專業分工與生態系整合的重要性。
從競爭走向合作:AI時代的策略聯盟
英特爾與輝達的關係,從20年前英特爾試圖以200億美元收購輝達未果,到如今輝達斥資50億美元入股英特爾,這場角色互換的戲碼足以讓半導體產業的老兵們瞠目結舌。曾幾何時,英特爾是CPU的代名詞,輝達則以GPU稱雄,雙方在Larrabee專案和晶片組爭議等多次衝突中互不相讓。然而,隨著輝達華麗轉身,從一家遊戲繪圖公司一躍成為價值超過4兆美元的全球AI超級巨頭,而英特爾則面臨市佔率下滑與巨額虧損的困境。
2025年,情勢徹底扭轉。輝達不僅投資英特爾股票,更將與其深度技術合作。在資料中心方面,英特爾將為輝達的AI平台設計客製化x86 CPU,並透過NVLink技術連接,以最大化頻寬和效率。在個人電腦領域,英特爾計畫於2027年起,推出內嵌輝達RTX GPU晶片的x86系統單晶片(SOC),目標鎖定主流筆記型電腦和手持設備。這些「Intel x86 RTX SOCs」將採用NVLink介面實現更緊密的CPU與GPU整合,並具備統一記憶體存取(UMA)能力。
技術融合:x86、NVLink與Gaudi的潛力
這項合作之所以不同尋常,核心在於兩個技術支柱:x86-64授權與輝達專有的NVLink互連技術。x86指令集是幾乎所有PC和伺服器CPU的基礎,一直由英特爾和AMD嚴格控制。透過此次合作,英特爾為輝達設計客製化x86 CPU,等於向輝達開放了一道其無法單獨跨越的技術護城河,使英特爾成為輝達CUDA生態系統中不可或缺的CPU供應商。NVLink則是輝達於2016年推出的高速互連技術,旨在解決PCIe無法滿足現代加速器頻寬需求的挑戰。
除了與輝達的策略合作,英特爾自家的Gaudi NPU也在AI領域展現出不容小覷的潛力。一項對Intel Gaudi-2 NPU與NVIDIA A100 GPU的綜合評估指出,Gaudi-2在基礎AI運算、記憶體和通訊操作方面,展現出與A100匹敵的競爭力。特別是針對常見的矩陣乘法運算(GEMM),Gaudi-2的MME(矩陣乘法引擎)具備動態重新配置能力,使其在處理不規則形狀的GEMM時,能達到更高的運算利用率。在大型語言模型(LLM)的推論服務中,單一Gaudi-2設備平均能比A100提供1.47倍的加速,並提升48%的能源效率,即便在多設備部署Llama-3.1-70B模型時,Gaudi-2也顯示出優越的效能和能源效率。然而,Gaudi-2在小於256位元組的向量記憶體存取效率上仍遜於A100,且其點對點(P2P)的通訊架構導致在少量設備協同通訊時頻寬利用率下降。
軟體生態與可程式性挑戰:超越CUDA護城河?
儘管Gaudi NPU在硬體性能上具備競爭力,但在軟體可程式性方面仍面臨挑戰。NVIDIA的CUDA生態系統因其靈活的程式設計介面和豐富的後端函式庫(如cuBLAS、cuDNN)而成為AI開發的業界標準。Gaudi SDK目前缺乏直接程式設計MME單元的底層API,使得MME的效能優化只能在PyTorch等高層次框架中,透過Gaudi圖形編譯器(graph compiler)進行。這種黑箱作業模式對開發者而言,限制了更深層次的效能調優。
然而,透過軟體層面的優化策略,Gaudi NPU仍能大幅提升性能。例如,針對推薦系統(RecSys)的嵌入式查詢操作,開發者可透過客製化的TPC-C核心實作「BatchedTable」機制,將多個嵌入表查詢批次處理為單一核心執行,顯著提升記憶體頻寬利用率。在大型語言模型服務的vLLM案例中,透過PyTorch層級的優化(vLLM*opt*),重構資料結構以消除冗餘的KV快取區塊讀取,結合圖形編譯器的最佳化排程,使得PagedAttention的吞吐量大幅提升,最終使Gaudi-2在端到端LLM性能上與A100達到相近的水平。這表明,輝達的CUDA編程系統本身可能不是一道不可逾越的「護城河」,其真正的實力在於其豐富且成熟的軟體生態系統。
產業震盪與未來展望
英特爾與輝達的結盟,無疑在整個半導體產業投下了震撼彈。對於AMD而言,作為唯一同時生產CPU和GPU的公司,其在筆記型電腦、遊戲掌機和APU(加速處理單元)領域的整合優勢將面臨直接挑戰。英特爾自家的Arc顯示卡品牌未來也將處境堪憂,因為在輝達RTX晶片組將直接嵌入英特爾SoC的背景下,繼續大力投資Arc的邏輯性將受到質疑。儘管輝達旗艦級GPU業務仍依賴台積電(TSMC)生產,但這項合作也可能為英特爾代工服務(Intel Foundry)未來爭取輝達的晶圓生產訂單開啟大門。
在地緣政治層面,美國政府作為英特爾的大股東之一,這項合作也符合其推動「美國隊」半導體聯盟的國家安全策略。對輝達而言,這在出口審查日益嚴格之際,提供了政治保護。對英特爾而言,這不僅是財務上的及時雨,更是重拾業界信譽的機會。然而,挑戰依然存在:首批客戶SoC預計要到2027年或2028年才能問世,這為AMD和蘋果(Apple)留下了數年的時間來鞏固其優勢。異質系統的整合難度,以及英特爾能否在先進製程節點的量產上證明自己,都將是決定此聯盟成敗的關鍵因素。
總結
曾經的對手,如今卻在AI時代選擇攜手共進,英特爾與輝達的策略聯盟,不僅是兩家公司尋求生存與發展的務實選擇,更深層次地揭示了未來運算領域的發展趨勢。單一公司獨佔整個技術棧的時代已經過去,未來的進步將來自於各個領域的專家,將CPU、GPU、互連技術和軟體整合到統一的平台生態系統中。這場合作能否成功,將取決於雙方的執行力,以及能否在整合複雜技術的同時,為市場帶來真正創新的產品。這場半導體巨頭的史詩級合作,將深刻影響AI、PC乃至全球晶片市場的未來走向,值得我們持續關注。





