Supermicro 支援 AMD Instinct MI300 系列加速器,擴展人工智能和 GPU 機架規模解決方案

「加三嘻行動哇 Yipee! 成為好友」

FacebookYoutubeTwitterInstagramTelegramLine

Supermicro 推出支援  AMD Instinct™ MI300X 加速器推動的全新 8-GPU 系統,具備突破性的人工智能和 HPC 性能,可用於大規模人工智能訓練和 LLM 部署。

Supermicro, Inc. 宣佈推出三款全新 AMD 為本 H13 代的 GPU 伺服器產品。這些已改良的伺服器,以全新 AMD Instinct MI300 系列加速器推動,提供先進效能和效率。Supermicro 的強勁機架規模解決方案,配備 8-GPU 伺服器和 AMD Instinct MI300X OAM 配置,現為大型模型訓練的選擇。

全新 2U 液冷和 4U 風冷伺服器,均配備 AMD Instinct MI300A 加速處理器 (APU) 加速器。這提升數據中心效率,並滿足人工智能、LLM 和 HPC 的快速增長兼複雜需求。該等全新系統均配備四個可擴展應用程式的 APU。Supermicro 可為大型環境提供完整液冷機架。每個機架的 FP64 性能均高達 1,728 TFlops。Supermicro 全球多間製造廠可簡化這些新型伺服器的供應,實現人工智能和 HPC 融合。

Supermicro 執行長兼總裁 Charles Liang 表示:「我們非常高興能夠利用最新一代 AMD Instinct 加速器,擴展我們為人工智能訓練而提供的機架規模全面 IT 解決方案。這與前幾代相比,性能提升高達 3.4 倍。憑藉我們全球多間製造廠每月產能 4,000 個液冷機架,可透過 AMD Instinct MI300X 加速器或 AMD Instinct MI300A APU 提供最新 H13 GPU 解決方案。我們經驗證的架構為每個為大規模人工智能設計的 GPU 和多個兼容完全整合液體冷卻解決方案的超級電腦叢集,提供 1:1 400G 網絡。這部署容易,賦予客戶性能和卓越效率的競爭優勢。」

LLM 優化的 AS –8125GS-TNMR2 系統,在 Supermicro 的構建塊架構上建立。這是個經驗證的設計,適用於以風冷和液冷機架規模設計的高性能人工智能系統。這平衡系統設計連結 GPU 與 1:1 網絡,提供跨節點和機架的大量高頻寬儲存。這配合現時最大參數高達數萬億的語言模型,盡量提升平行運算,並盡量減少訓練時間和推理延遲。配備 MI300X OAM 加速器的 8U 系統,透過 AMD Infinity Fabric™ Links 提供 8-GPU 原始加速能力。這系統在配備業界領先的 1.5TB HBM3 GPU 記憶體的單一系統,以及為省電、縮短運算週期和減少人工智能工作量使用記憶體而設計的原生稀疏矩陣支援的開放標準平台上,可實現高達 896GB/s 峰值的理論 P2P I/O 頻寬 。每台伺服器均配備雙插 AMD EPYC™ 9004 系列處理器,核心數量高達 256 個。在機架規模上,超過 1000 個 CPU 核心、24TB DDR5 記憶體、6.144TB HBM3 記憶體和 9728 個運算單元,可在多個最具挑戰性的人工智能環境中應用。Supermicro 擁有豐富的 8U 配置經驗,並使用 OCP 加速器模組 (OAM),帶來完全配置的伺服器。這比客製設計更快投入市場,從而降低成本和縮短供應時間。

Supermicro 也推出已改良密度的 2U 液冷伺服器 AS –2145GH-TNMR和 4U 風冷伺服器 AS –4145GH-TNMR,而每台伺服器均配備 4 個 AMD Instinct™ MI300A 加速器。該等全新伺服器,均為需要極快 CPU 到 GPU 通訊的 HPC 和人工智能應用程式而設計。APU 在單一晶片上,透過組合最高效能的 AMD CPU、GPU 和 HBM3 記憶體,消除多個多餘記憶體的副本。每台伺服器為了應用程式擴展,均配備先進的 x86「Zen4」CPU 核心。此外,每台伺服器還配備 512GB HBM3 記憶體。以 21 個 2U 系統組成的全機架 (48U) 解決方案中,可使用超過 10TB 的 HBM3 記憶體和 19,152 個運算單元。然而,HBM3 到 CPU 記憶體的頻寬為 5.3 TB/s。

這兩款系統以雙 AIOM 為特點,配備 400G 乙太網路支援,以及為高效能運算而設計多個改善空間、擴展度和效率的擴充網絡選項。該 2U 直接晶片液冷系統,帶來極佳整體擁有成本 (TCO)。根據 21 個 2U 系統機架解決方案,每機架產出 61,780 瓦功率,而風冷機架功率為 95,256 瓦。這耗能節省可達 35% 以上,單一風冷系統更可減少 70% 風扇數量。

AMD 執行副總裁兼數據中心解決方案業務部總經理 Forrest Norrod 表示:「AMD Instinct MI300 系列加速器,不論為長期加速的高效能運算應用程式,還是快速成長的生成式人工智能需求,均提供傲視業界的效能。我們將繼續與 Supermicro 緊密合作,並根據 MI300 系列加速器和利用 Supermicro 的系統和數據中心設計專業知識,為市場帶來首屈一指的人工智能和 HPC 全面解決方案。」

資料來源:美通社、Supermicro

好友人數

大家對網站文章上的一個讚、+1及轉分享,都是對我們的最好的鼓勵及繼續下去的原動力,請大家不要吝嗇。

下一頁

【限時免費】多人競技場大戰《GigaBash 巨擊大亂鬥》和快節奏動作遊戲《Predecessor》放送中,2023 年 12 月 14 日凌晨 00:00 截止

週五 12 月 8 , 2023
「加三嘻行動哇 Yipee! 成為好友」 【Facebook、Youtube、Twitter、Ins […]
Shares