2025年重点建设学科算力平台建设项目采购公示

撰稿:罗鑫龙 时间:2025-05-09 点击数:

学校拟在西城校区核心机房按满足满血版Deepseek-R1 671B部署的基本要求采购建设学校智算平台,建设总算力(FP16)至少4.4PFLOPS,实现CPU/GPU/NPU异构算力统一调度分配。具体采购需求见附件。

本项目已通过本单位项目论证,现予以公示。

公示时间:202559日至2025515日。

在公示期间,个人和单位均可通过来信、来电、来访等形式,向现代教育技术中心反映意见。

联系人:罗鑫龙  联系电话:15775034197


现代教育技术中心

202559

附件:

拟申购物资清单

序号

物资名称

厂家、品牌及主要技术参数(可附件)

(预算金额10万元及以上的采购项目不能填写厂家、品牌)

申购数量

计量

单位

备注

1

算力节点

1、国产品牌,非OEM产品;

2、单计算节点≥4CPU,单颗处理器:核心数≥48核,主频≥2.6GHz

3、单节点算力FP16 2.2 PFLOPS FP32 0.60 PFLOPS;配置GPU/NPU卡≥8张,单张卡芯片配置≥64G显存,每张卡AI处理器含200GE   Roce网口(含光模块)

4GPU/NPU卡之间至少支持采用HCCSNvlinkMLU-LinkPCIE互联之一;

5、内存:提供≥1T DDR4/RDIMM内存,内存插槽≥32个;

6、硬盘:提供NVME 硬盘≥2块,每块≥7.68TB, 提供SSD硬盘≥2块,每块SSD硬盘≥960G

7、阵列卡:支持≥2GB RAID卡,支持多种RAID模式,支持RAID 0,1,5,6,10,50,60

8、网络参数:提供≥8200GE光口,满配200G高速光模块;

9、电源:配置4个≥2600W AC电源,支持冗余;

10、提供3年产品质量维保服务;

11、集成软硬件交付实施服务:

1)机房电源处理:针对机房电源环境进行全面评估,实施电源分配、布线及防雷接地改造,确保设备供电稳定可靠,降低故障风险。

2)硬件上架:根据机房布局与设备规格,完成算力节点、数据存储一体机、数据中心交换机、终端交换机等硬件的精准上架安装、布线及物理连接,确保设备高效运行。

3)存储数据处理服务:提供存储设备配置、数据迁移、备份恢复及性能调优服务,保障数据安全性、完整性与高效访问。

4)软件部署:依据业务场景,完成操作系统(至少包括LinuxWindowsUbuntu近三年成熟版本)、中间件、DeepSeek主流版本及可视化互动系统、以及相关业务应用的安装、配置与集成,实现系统功能无缝对接与高效运行。以部署DeepSeek-R1 70B模型为基准,整体算力平台应满足100个用户并发。

5)系统调测:对硬件、软件及网络进行联合调试,验证系统功能、性能及稳定性,排查并解决潜在问题,确保系统满足交付标准。

2


2

算力调度管理系统

1、虚拟主机(简称主机)管理功能:系统需支持物理算力节点的全生命周期管理

1)支持手动录入或网段批量扫描添加主机;

2)允许编辑配置、状态及移除主机(保留历史数据);

3)列表展示主机名、IP、标签、状态、到期时间等字段,并支持多维度排序筛选;实时监测在线/离线状态,动态更新展示;

4)支持通过Web界面远程直接进行关开机操作,支持通过Web界面设置定时任务的方式自动进行远程开关机。

5)支持周期性与非周期性两种任务设置方式,周期性设置支持以天、周、月为周期进行设置,非周期性支持只执行一次开关机操作。

2、资源管理功能

1)能实现对硬件资源(包括不限于GPUNPUCPU、内存、磁盘等)的灵活分配和管理。

2)管理员创建新的用户账号,并按时间段、授权权限给用户分配相应的资源(同一资源在同一天内可按不同时间段分配给不同用户使用),在分配后,用户只能在所分配时间段内访问所授权的资源;

3)管理员对用户授权访问的资源以及访问的时间段进行更改;

4)管理员对分配的资源进行回收,同时可显示所有用户的用户名,每个用户被授权允许访问的主机数、资源数、回收后保留用户和恢复数据;

5)资源到期前,具备定时提醒用户的功能;

6)资源到期后,管理员有权限将用户强制下线并回收资源。回收后保留用户数据,用户在下个授权有效时间段内可以以相同账号登录并恢复其数据;

7)对云盘等分布式存储资源的管理,支持用户挂载、卸载;

8)支持物理主机、容器、云主机等资源分配方式,实现快速搭建环境、用户开发环境隔离等特性;

9)通过平台以Web的方式直接登录被授权的物理主机、容器以及云主机并进行操作;也可直接通过SSH的方式登录被授权的物理主机进行访问操作。

3、资源监控功能

1)可查看所有设备整体概况:算力节点数量、算力卡数量、总算力、实时功耗、各台机器基本信息概览;

2)查看设备详情监控:GPU信息、CPU信息、内存使用率;

3)查看算力卡详情监控:算力卡数量、算力卡型号、驱动版本、单卡算力、当前性能等级、实时功耗、实时使用率、实时温度、显存大小、实时显存使用率、显卡带宽、算力卡核心频率等。

4)支持算力卡设备进行统一监控和预警。

5)内置集成算力卡使用时长统计功能:支持通过Web界面对每一张算力卡每天的实际使用时间进行实时统计。

4、告警管理功能

1)基于规则配置,触发告警事件,可利用算力设备基本硬件、软件运行状况实时信息作为告警条件,产生告警事件,告警规则支持实时启用;

2)通过平台直接连接设备终端进行远程故障诊断。

5、系统管理功能

1)管理员可创建、编辑和删除不同的用户角色,并为每个角色分配相应的权限,以控制访问级别和操作范围。

2)系统每周自动向管理员发送一次周报,简要汇报上一周计算资源使用情况。

3)支持对用户资源的快照,以及资源快照的备份、恢复、删除等管理。

6、应用管理功能:

1)支持软件应用的增删改查及配置设置;支持设置当前应用的每个组件,添加应用的版本、组件的版本,设置YML文件;支持应用部署脚本的管理、脚本版本的设置,环境变量的新增、修改、删除、导入;支持基于文件组的方式添加应用的配置文件;支持文件组的新增、修改、导入,允许文件组上传、在线编辑多个文件;允许应用快照的管理,通过快照绑定部署脚本、组件版本、文件组、环境变量再利用快照部署智算软件;能够利用快照对主机进行部署、通过配置部署策略进行部署;

2)支持纳管的算力品牌类型包括:英伟达、华为腾、百度昆仑芯等;

3)支持远程纳管算力:在两地网络已构建隧道并处于同一局域网内的情况下,可根据在同一个局域网内的IP地址,通过寻址的方式,对算力服务器进行识别并纳管。

7AI模型管理模块

1)支持在线部署和API接入模式实现模型快速纳管,支持模型的试用和订阅;

2)支持插件的管理,支持插件接入,可以通过智能体加载使用;

3)知识库的管理,支持EXCELTXTWORD等各种形式的知识库的一键挂载,并通过向量模型实现知识库匹配检索;

8、提供智能体的使用。

9、提供3年产品质量维保服务,维保期后,产品应能不受限制继续正常使用。

1


3

数据中心交换机

1、提供≥24200G QSFP56 以太网光口,提供≥8400G QSFP-DD 以太网光口,提供16200G QSFP56多模光模块,适用于数据中心交换机及算力节点设备之间的连接。

2、交换容量≥16Tbps,包转发率≥4800Mpps

3IPv4下支持静态路由和OSPFv2路由;IPv6下支持静态路由和OSPFv3路由。

4、提供3年产品质量维保服务。

1


4

终端交换机

1、提供≥4810/100/1000BASE-T以太网端口;

2、交换容量≥672Gbps,包转发率≥207Mpps

3、提供≥4个万兆SFP+以太网端口;

4、支持交流供电;

5、提供≥410公里单模光模块SFP+10G,提供≥440公里单模光模块SFP+10G

6、提供3年产品质量维保服务。

3


5

数据存储一体机

1、提供≥2*480GB SATA SSD,   提供≥10*16TB SATA 7.2K 256M HDD,整机支持3.5英寸热插拔硬盘位数量≥36,整机支持2.5英寸热插拔硬盘位数量≥2M.2插槽数量≥2M.2插槽支持SATAPCIe协议硬盘,支持2242/2260/2280三种规格硬盘;

2、支持2GB RAID卡,支持多种RAID模式,支持RAID 0,1,5,6,10,50,60

3、支持PCIe X16插槽数量≥2PCIe X8插槽数量≥4,支持OCP设备;

4、提供≥410/25GE光口,满配25G高速光模块;

5、电源配置≥2800W 80PLUS白金认证电源,支持冗余;

6、提供3年产品质量维保服务。

1






地址:广东省茂名市官渡二路139号第二教学楼A楼11楼  邮编:525000

Copyright 广东石油化工学院 现代教育技术中心  粤ICP备05008880号