产品中心

产品中心

+
  • RA5900-B(压缩后).png

兆瀚RA5300-B AI 推理服务器

兆瀚RA5300-B 推理服务器采用8模组高效推理方式,提供强劲AI 推理能力,在算力、内存带宽和互联能力方面具有优势,可广泛应用于生成式大模型推理,例如智能客服、文案生成、知识沉淀等内容生成类场景,支持2.2 PFLOPS FP16 算力和 392GB/s NPU互联,提升大模型推理效率。

所属分类:

人工智能产品

产品中心


产品描述

产品优势

| 更强算力密度

● 4U高度最高提供 2.2 PFLOPS FP16业界领先算力

● 搭载8颗超强算力的昇腾AI模组,高效加速应用

| 极致能效比

提供0.6 PFLOPS / kW超高能效比,节省运营费用

| 高速网络带宽

8*200GE RoCE v2高速接口

 

● 可提供8路NPU通过HCCS Full mesh互联,双向互联带宽达392GB/s

应用场景

部署在数据中心机房,使能中心推理,例如智能客服、文案生成、知

识沉淀等内容生成类场景。

技术规格

产品形态        4U AI服务器


NPU               8 * 昇腾AI模组


CPU               4 * 鲲鹏920


AI算力           4.4 P OPS INT8

                      2.2 P FLOPS FP16

                      0.60 P FLOPS FP32


HBM          256GB,带宽800GB/s


内存            32个DDR4内存插槽,最高3200 MT/s

                   单根内存条容量支持16 / 32 / 64 GB


本地存储       8 * 2.5 SATA+2 * 2.5 NVMe

                     4 * 2.5 SATA+6 * 2.5 NVMe


RAID支持      支持 RAID 0 / 1 / 10 / 5 / 50 / 6 / 60


网络               8 * 200GE QSFP接口直出,RoCE协议


PCIe接口        最多支持3个PCIe 4.0扩展插槽


电源               4个热插拔2.6 kW电源模块,支持2+2冗余


供电               200 ~ 240 V AC

                      240 V DC


散热方式         风冷

风扇                支持8个热拔插风扇模组,支持N+1冗余


工作环境温度     5℃~35℃(41℉~95℉)

结构尺寸          175 mm(高) * 447 mm(宽)* 790 mm(深)