英特爾與輝達世紀聯盟：共譜AI基礎設施與個人運算新篇章，Gaudi NPU如何挑戰CUDA護城河？

曾經的對手，今日的盟友：重塑AI運算版圖

曾經的半導體巨頭英特爾（Intel）與繪圖晶片王者輝達（Nvidia）之間的激烈競爭，是業界數十年來的縮影。然而，在AI浪潮席捲全球的今日，這兩家曾經的勁敵卻選擇攜手合作，共同開創 AI基礎設施與個人運算的新篇章。這項令華爾街震驚的歷史性合作，不僅涉及輝達對英特爾的巨額投資，更將透過技術融合，重塑未來的運算版圖，並可能改變Nvidia在AI領域的「CUDA護城河」地位。

這項策略性聯盟的核心，是兩家公司意識到在日益複雜的AI軍備競賽中，單打獨鬥已難以維繫。輝達對英特爾的50億美元投資，以及雙方在資料中心和個人電腦領域的深度技術合作，預示著半導體產業一個新時代的來臨，強調專業分工與生態系整合的重要性。

從競爭走向合作：AI時代的策略聯盟

英特爾與輝達的關係，從20年前英特爾試圖以200億美元收購輝達未果，到如今輝達斥資50億美元入股英特爾，這場角色互換的戲碼足以讓半導體產業的老兵們瞠目結舌。曾幾何時，英特爾是CPU的代名詞，輝達則以GPU稱雄，雙方在Larrabee專案和晶片組爭議等多次衝突中互不相讓。然而，隨著輝達華麗轉身，從一家遊戲繪圖公司一躍成為價值超過4兆美元的全球AI超級巨頭，而英特爾則面臨市佔率下滑與巨額虧損的困境。

2025年，情勢徹底扭轉。輝達不僅投資英特爾股票，更將與其深度技術合作。在資料中心方面，英特爾將為輝達的AI平台設計客製化x86 CPU，並透過NVLink技術連接，以最大化頻寬和效率。在個人電腦領域，英特爾計畫於2027年起，推出內嵌輝達RTX GPU晶片的x86系統單晶片（SOC），目標鎖定主流筆記型電腦和手持設備。這些「Intel x86 RTX SOCs」將採用NVLink介面實現更緊密的CPU與GPU整合，並具備統一記憶體存取（UMA）能力。

技術融合：x86、NVLink與Gaudi的潛力

這項合作之所以不同尋常，核心在於兩個技術支柱：x86-64授權與輝達專有的NVLink互連技術。x86指令集是幾乎所有PC和伺服器CPU的基礎，一直由英特爾和AMD嚴格控制。透過此次合作，英特爾為輝達設計客製化x86 CPU，等於向輝達開放了一道其無法單獨跨越的技術護城河，使英特爾成為輝達CUDA生態系統中不可或缺的CPU供應商。NVLink則是輝達於2016年推出的高速互連技術，旨在解決PCIe無法滿足現代加速器頻寬需求的挑戰。

除了與輝達的策略合作，英特爾自家的Gaudi NPU也在AI領域展現出不容小覷的潛力。一項對Intel Gaudi-2 NPU與NVIDIA A100 GPU的綜合評估指出，Gaudi-2在基礎AI運算、記憶體和通訊操作方面，展現出與A100匹敵的競爭力。特別是針對常見的矩陣乘法運算（GEMM），Gaudi-2的MME（矩陣乘法引擎）具備動態重新配置能力，使其在處理不規則形狀的GEMM時，能達到更高的運算利用率。在大型語言模型（LLM）的推論服務中，單一Gaudi-2設備平均能比A100提供1.47倍的加速，並提升48%的能源效率，即便在多設備部署Llama-3.1-70B模型時，Gaudi-2也顯示出優越的效能和能源效率。然而，Gaudi-2在小於256位元組的向量記憶體存取效率上仍遜於A100，且其點對點（P2P）的通訊架構導致在少量設備協同通訊時頻寬利用率下降。

軟體生態與可程式性挑戰：超越CUDA護城河？

儘管Gaudi NPU在硬體性能上具備競爭力，但在軟體可程式性方面仍面臨挑戰。NVIDIA的CUDA生態系統因其靈活的程式設計介面和豐富的後端函式庫（如cuBLAS、cuDNN）而成為AI開發的業界標準。Gaudi SDK目前缺乏直接程式設計MME單元的底層API，使得MME的效能優化只能在PyTorch等高層次框架中，透過Gaudi圖形編譯器（graph compiler）進行。這種黑箱作業模式對開發者而言，限制了更深層次的效能調優。

然而，透過軟體層面的優化策略，Gaudi NPU仍能大幅提升性能。例如，針對推薦系統（RecSys）的嵌入式查詢操作，開發者可透過客製化的TPC-C核心實作「BatchedTable」機制，將多個嵌入表查詢批次處理為單一核心執行，顯著提升記憶體頻寬利用率。在大型語言模型服務的vLLM案例中，透過PyTorch層級的優化（vLLM*opt*），重構資料結構以消除冗餘的KV快取區塊讀取，結合圖形編譯器的最佳化排程，使得PagedAttention的吞吐量大幅提升，最終使Gaudi-2在端到端LLM性能上與A100達到相近的水平。這表明，輝達的CUDA編程系統本身可能不是一道不可逾越的「護城河」，其真正的實力在於其豐富且成熟的軟體生態系統。

產業震盪與未來展望

英特爾與輝達的結盟，無疑在整個半導體產業投下了震撼彈。對於AMD而言，作為唯一同時生產CPU和GPU的公司，其在筆記型電腦、遊戲掌機和APU（加速處理單元）領域的整合優勢將面臨直接挑戰。英特爾自家的Arc顯示卡品牌未來也將處境堪憂，因為在輝達RTX晶片組將直接嵌入英特爾SoC的背景下，繼續大力投資Arc的邏輯性將受到質疑。儘管輝達旗艦級GPU業務仍依賴台積電（TSMC）生產，但這項合作也可能為英特爾代工服務（Intel Foundry）未來爭取輝達的晶圓生產訂單開啟大門。

在地緣政治層面，美國政府作為英特爾的大股東之一，這項合作也符合其推動「美國隊」半導體聯盟的國家安全策略。對輝達而言，這在出口審查日益嚴格之際，提供了政治保護。對英特爾而言，這不僅是財務上的及時雨，更是重拾業界信譽的機會。然而，挑戰依然存在：首批客戶SoC預計要到2027年或2028年才能問世，這為AMD和蘋果（Apple）留下了數年的時間來鞏固其優勢。異質系統的整合難度，以及英特爾能否在先進製程節點的量產上證明自己，都將是決定此聯盟成敗的關鍵因素。

總結

曾經的對手，如今卻在AI時代選擇攜手共進，英特爾與輝達的策略聯盟，不僅是兩家公司尋求生存與發展的務實選擇，更深層次地揭示了未來運算領域的發展趨勢。單一公司獨佔整個技術棧的時代已經過去，未來的進步將來自於各個領域的專家，將CPU、GPU、互連技術和軟體整合到統一的平台生態系統中。這場合作能否成功，將取決於雙方的執行力，以及能否在整合複雜技術的同時，為市場帶來真正創新的產品。這場半導體巨頭的史詩級合作，將深刻影響AI、PC乃至全球晶片市場的未來走向，值得我們持續關注。

曾經的對手，今日的盟友：重塑AI運算版圖

從競爭走向合作：AI時代的策略聯盟

技術融合：x86、NVLink與Gaudi的潛力

軟體生態與可程式性挑戰：超越CUDA護城河？

產業震盪與未來展望

總結

目前趨勢