高通如何以AI200與AI250晶片,憑藉低功耗優勢,顛覆AI資料中心市場與生成式AI未來
AI時代新篇章:高通進軍資料中心市場
全球晶片巨擘高通(Qualcomm)正積極拓展其成長藍圖,將重心從傳統的智慧型手機領域,大膽地轉向蓬勃發展的資料中心與延展實境(XR)市場。這項策略性轉變的關鍵,在於高通憑藉其在低功耗晶片設計和擴展性方面的深厚積累,推出一系列專為AI資料中心設計的AI推理加速器。隨著人工智慧技術,特別是生成式AI與大型語言模型(LLM)的快速崛起,對高效能、低功耗運算的需求激增,高通的這一步棋,旨在重新定義AI基礎設施的未來,提供具備成本效益且彈性十足的解決方案。
高通在2025財年第四季財報會議中,明確勾勒了其多元化策略,並隨後重磅發布了基於AI200和AI250晶片的加速器卡及機架解決方案。這些創新產品的問世,不僅展現了高通在NPU(神經處理單元)技術方面的領導地位,更預示著AI運算將邁入一個更節能、更具擴展性的新紀元。此舉不僅提升了公司在資本市場上的能見度,也讓投資者對其長期成長抱持樂觀態度。
AI200與AI250:引領資料中心AI推理新時代
高通推出的AI200和AI250推理加速器,代表了其在AI資料中心領域的決心與實力。這兩款產品的核心目標是為AI時代提供機架級效能與業界領先的總持有成本(TCO)。根據高通官方發布的資訊,AI200和AI250將分別於2026年和2027年上市,並提供加速器卡和機架兩種形式,延續高通在低功耗、高效能運算以及AI領域的優良傳統。
特別值得關注的是,AI200解決方案是專為低TCO和優化大型語言模型(LLM)及多模態模型(LMM)推理而設計的機架級AI推理方案。每張AI200加速器卡支援高達768 GB的LPDDR記憶體,提供卓越的記憶體容量,同時降低成本,為AI推理應用帶來了無與倫比的擴展性和靈活性。這些特性使其成為企業和開發者部署安全、可擴展生成式AI的理想選擇,推動各行各業實現靈活、高效且具成本效益的AI應用。
技術創新:近記憶運算與高效能記憶體
高通AI250解決方案引入了創新的記憶體架構,其核心技術是近記憶運算(Near-Memory Computing)。這種革命性的設計將運算能力更靠近實體記憶體晶片,從而為AI推理工作負載帶來了效率和效能上的跨越式提升。相較於AI200,AI250能夠提供超過10倍的有效記憶體頻寬,並大幅降低功耗,有效解決了AI模型,特別是大型語言模型,對記憶體頻寬的龐大需求。
這種獨特的架構不僅顯著提升了AI推理的速度和效率,還實現了分離式AI推理(Disaggregated AI Inferencing),這表示硬體資源可以更有效地被利用,同時滿足客戶對效能和成本的嚴格要求。透過將高通在NPU領域的領導經驗與先進的記憶體創新相結合,AI250確立了在AI推理效率和能源消耗方面的新標準,為資料中心帶來了前所未有的彈性和可擴展性,尤其在處理複雜的生成式AI工作負載時表現出色。
整體解決方案:從硬體到軟體生態系
高通深知單純提供高性能硬體不足以贏得市場,因此其AI200和AI250機架解決方案,搭配了完善的軟體堆疊和開放的生態系統支援。這項超大規模(hyperscaler-grade)AI軟體堆疊涵蓋從應用層到系統軟體層的端到端方案,並針對AI推理進行了最佳化。它支援主流的機器學習(ML)框架、推理引擎以及生成式AI框架,確保與現有AI基礎設施的無縫相容性。
此外,為簡化開發者體驗,高通提供了豐富的工具、函式庫、API和服務,使AI模型的操作化變得輕而易舉。開發者可以透過高通的Efficient Transformers Library和Qualcomm AI Inference Suite,一鍵部署來自Hugging Face的模型,極大地加速了AI應用的開發與部署週期。這些機架解決方案還具備直接液體冷卻功能,以確保卓越的散熱效率;採用PCIe實現擴展(scale up)和乙太網路實現橫向擴展(scale out),提供靈活的連接選項;同時支援機密運算(confidential computing),保障AI工作負載的安全性。整個機架的功耗為160 kW,進一步突顯了其能源效率優勢。
市場影響與策略佈局:Humain合作與股價展望
高通進軍AI資料中心市場的舉措,不僅是一次技術上的飛躍,更是一項具有深遠意義的策略佈局。其中,與沙烏地阿拉伯支持的AI公司Humain達成的大型部署協議,成為此次擴張的亮點之一。根據協議,Humain計畫從2026年開始,部署高通AI200和AI250機架解決方案,用於全球高性能AI推理服務,目標是達到200兆瓦(megawatts)的規模。這項合作不僅為高通帶來了首個重量級客戶,也為其AI資料中心產品在全球市場的推廣奠定了堅實基礎 Qualcomm Unveils AI200 and AI250—Redefining Rack-Scale Data Center Inference Performance for the AI Era。
市場對此策略轉變反應積極。高通的股價在消息發布後表現出強勁的上升勢頭,儘管短期內股價有所波動,但其90天股價回報率達18.5%,三年總股東回報率更是高達64.6%,顯示了市場對其AI策略轉型的長期樂觀預期 A Look at Qualcomm’s Valuation Following Its AI Data Center Expansion and Humain Partnership。分析師普遍認為,高通目前股價相較於其公允價值仍有適度折讓,預計其在資料中心和下一代連接技術方面的戰略擴張,將能拓寬其可尋址市場,支持長期可持續增長。然而,來自內部晶片製造商的持續競爭以及不斷演變的監管審查,仍可能對高通的發展勢頭構成挑戰。
結論:Qualcomm在AI資料中心競賽中的未來展望
高通憑藉其在AI200和AI250加速器上的創新,以及對低功耗、高效能運算的堅定承諾,已在AI資料中心競賽中取得了關鍵的一步。這些解決方案,特別是AI250的近記憶運算架構和超過10倍有效記憶體頻寬的提升,展現了高通在應對生成式AI嚴苛需求方面的領先技術實力。從底層硬體設計到完整的軟體生態系統,高通提供了一套全面的解決方案,旨在降低AI部署的總持有成本並加速創新。
與Humain的合作為高通的資料中心戰略注入了強心劑,驗證了其技術在現實世界中的應用潛力。儘管面臨市場競爭與挑戰,高通「AI優先」的願景,結合其在NPU技術和能源效率方面的獨特優勢,使其成為AI基礎設施領域不可忽視的參與者。隨著AI技術的不斷演進,高通將持續以其每年更新的產品路線圖,引領AI運算的未來,為各行各業帶來更智慧、更高效的數位轉型。





