2025世界人工智能大會(WAIC 2025)現(xiàn)場,恒為科技聯(lián)合算能重磅發(fā)布并展出行業(yè)內(nèi)首個國產(chǎn)TPU正交架構(gòu)超節(jié)點(diǎn)—AS9000系列正交架構(gòu)128 AI超節(jié)點(diǎn),以全新架構(gòu)設(shè)計重塑國產(chǎn)智算底座。
該產(chǎn)品通過計算節(jié)點(diǎn)與交換節(jié)點(diǎn)正交耦合技術(shù),創(chuàng)新性消除內(nèi)部線纜連接,突破傳統(tǒng)架構(gòu)物理限制,實(shí)現(xiàn)超高密度算力整合與超大容量Scale Up擴(kuò)展能力,顯著降低AI芯片間通信時延,賦能推理效能躍升。同時,該產(chǎn)品在硬件層面深度集成國產(chǎn)CPU芯片與算能TPU芯片,采用風(fēng)液混合散熱方案,核心算力模塊液冷高效降溫,構(gòu)建國產(chǎn)算力新引擎,為持續(xù)高性能輸出提供堅實(shí)保障。
產(chǎn)品介紹
作為面向下一代人工智能計算平臺的高性能解決方案, AS9000系列正交架構(gòu)128 AI超節(jié)點(diǎn)集成128顆AI算力芯片和多達(dá)8T的顯存空間,實(shí)現(xiàn)萬億級參數(shù)大模型的本地化部署,提供超強(qiáng)推理性能。該方案通過硬件級算力整合與算法協(xié)同,為金融、證券、能源等關(guān)鍵行業(yè)央國企提供超強(qiáng)推理性能的本地一體化部署能力,助力客戶在復(fù)雜場景中高效駕馭AI應(yīng)用,構(gòu)建高可靠智能化轉(zhuǎn)型新范式。
核心優(yōu)勢
? 支持單機(jī)部署萬億級參數(shù)規(guī)模大模型,支持未來更大參數(shù)規(guī)模模型
? Deepseek-R1推理輸出吞吐率可達(dá)6000-8000 token/s
? 更低單位算力成本,更高算力密度
? Scale Up靈活組網(wǎng),可通過配置交換板數(shù)量,實(shí)現(xiàn)互聯(lián)帶寬靈活配置
? Scale Up組網(wǎng)連接無需光模塊和線纜連接,降低連接成本并有效降低故障率
? 正交連接,縮短互聯(lián)路徑,降低網(wǎng)絡(luò)鏈路時延
? 支持多機(jī) Scale Out,靈活擴(kuò)展不同規(guī)模
? 一臺物理機(jī)集成所有組件,高度一體化
? TPU-CPU 解耦,靈活配置比例
? 支持靈活擴(kuò)展存儲
? 支持內(nèi)部 Serdes 接口升級到 224Gbps,未來可實(shí)現(xiàn)更高速率端口互聯(lián)
產(chǎn)品配置
產(chǎn)品型號 | AS9000 | |
智算節(jié)點(diǎn)數(shù)量 | 8 個 | |
智算節(jié)點(diǎn)配置 | 16 個 TPU | |
通算節(jié)點(diǎn)數(shù)量 | 1個 | |
交換節(jié)點(diǎn)數(shù)量 | 最多 6 塊 | |
TPU數(shù)量 | 每智算節(jié)點(diǎn)支持 16 顆,整機(jī)最大支持 128 顆 | |
顯存容量 | 單節(jié)點(diǎn) 1TB,整機(jī) 8TB | |
存儲容量 | 整機(jī) 34 個 2.5 寸可插拔硬盤槽,支持 NVME SSD | |
算力格式支持 | FP32/TF32/FP16/BF16/FP8/INT8等 | |
設(shè)備功耗 | 最大 16KW,典型 9.6KW(LLM推理場景下) | |
尺寸 | 17U | |
推理性能 | 模型名稱 | DeepSeek-R1 |
參數(shù) | 671B | |
數(shù)據(jù)精度 | FP8 | |
輸出吞吐 token/s | 6000–8000 | |
并發(fā)數(shù) | 128 |
聯(lián)系我們
歡迎垂詢并獲取
行業(yè)定制化 AI 解決方案咨詢
算力成本測算與 POC 測試支持
公司官網(wǎng): www.869q1.cn
聯(lián)系熱線: 021-61002300
封面配圖來源于官方發(fā)布,如有不妥,請聯(lián)系刪除