Skip to content

个人低功耗服务器升级记录(Ryzen + Tesla T10)

最初的契机是想换电脑了,手里只有一台 2020 年买的轻薄本,玩不了什么 3D 游戏,部署本地 AI 什么的也基本无缘。板载 16 G 内存由于核显和 CPU 共用,也有点捉襟见肘。纠结了半天是买新笔记本还是组装台式机,最后灵机一动,决定不如把个人服务器升级一下。

毕竟,手里的笔记本功能完好,本着物尽其用的理念接着用。

买新笔记本的话,需要好几千块预算不说,换下来的也卖不了多少钱,多半吃灰浪费,感觉划不来。而装台式机和笔记本搭配的方案,一来台式机移动不方便,平时需要来回跑,就只能在一个地方用;二来除显卡外会冗余一套配件,因为日常使用并不需要第二个相同的系统和为了运行它的第二颗 CPU。

而升级服务器的话,配置一块 GPU,游戏跑在服务器上,用笔记本能随时随地远程串流玩游戏。此外还可以部署一些 AI 应用,手机也能随时访问。

扯了半天,理想很美好,现实先试试。服务器原来的 CPU 还是低功耗双核 E3。十多年前的配置实在是过时了,二手市场一套加起来卖可能还没电源贵,丢掉都几乎没什么心理负担。

硬件配置

CPU

AMD Ryzen 3 PRO 5350GE

详细信息(点击展开)
  • 发布时间:2021 年 6 月
  • 架构:Zen 3 (Cezanne)
  • 制程:7 nm
  • TDP:35 W
  • PPT:47 W
  • 规格
    • 4 核心 8 线程
    • 基准频率 3.6 GHz ~ 加速频率 4.2 GHz
    • 一级缓存:每核 64 KB
    • 二级缓存:每核 512 KB
    • 三级缓存:共享 8 MB
  • 核芯显卡:AMD Radeon Graphics 384SP (Vega 6)

在挑选 CPU 时,主要考虑了三点:

  1. 待机功耗低(Zen 3 架构较新;带 E 后缀,限制了最大功耗,体质也略好)
  2. 自带核芯显卡
  3. Ryzen PRO 系列,支持 ECC 内存

其实还有 6 核的 5650GE 和 8 核的 5750GE,然而因为是拆机货,找不到卖家无奈选择了这款。性能方面可以类比 2024/2025 年入门处理器 Intel Core i3 12100。

主板

ASUS PRIME A520M-K

详细信息(点击展开)
  • 芯片组:A520
  • 扩展性
    • DDR4 内存插槽 * 2
    • PCIe 3.0 x16 插槽 *1
    • PCIe 3.0 x1 插槽 *2
    • M.2 (PCIe 3.0 x4) 插槽 *1
    • SATA 3.0 (6 Gb/s) 插槽 *4
  • 接口
    • 视频输出:VGA + HDMI
    • 网络:Realtek RTL8111H 1Gb
  • 尺寸:22.6 cm * 22.1 cm

对比类似的 B450 主板,因为 E 后缀的 AMD 处理器不支持超频,主板的最大亮点完全用不上;此外是扩展能力的差异,A520 提供 4 条 PCIe 3.0,B450 提供 6 条 PCIe 2.0,其实差距不大。再对比 B550 主板,Cezanne 系列处理器仅支持 PCIe 3.0,更加昂贵的 B550 提供的 PCIe 4.0 功能也无法利用。

在具体型号选择上,主要考虑了华硕主板支持 ECC 内存的特性。A520M-K 比较常见,相比 M-A 少了 2 个内存插槽,但比 M-R 多一个 PCIe 3.0 x1 插槽。

此外还要吐槽一点:比起服务器级主板,消费级主板提供的额外功能很少。这块入门级主板各种外围配置的级别也完全比不上旧的 Asus P8B-X 服务器主板(C202 芯片组),且没有诊断灯、蜂鸣器,难以判断硬件哪里出了问题。组装时一开始没点亮,以为哪里翻车了,又因为没有备用配件,排查了老半天,最后还是自己查主板说明书才发现原因是内存不兼容。

内存

ADATA ECC DDR4 2666 Mhz 16 G * 1

DDR4 ECC 内存的校验特性能消除内存位意外翻转造成的影响,提高系统稳定性。

缺点是频率不高(高的比较贵,服务器用这个够了),单通道吞吐量打对折,导致核显性能降低。

注意

消费级主板大多仅支持 Unbuffered 内存,即“纯 ECC”,使用 REG ECC 内存无法开机。

GPU

NVIDIA Tesla T10 16 GB

详细信息(点击展开)
  • 发布时间:2020

  • 架构:Turing (TU102)

  • 制程:12 nm

  • TDP:150 W(1 x 8-pin 供电)

  • 规格

    硬件单元共 56 组 SM
    Shading Units56 * 64 = 3584
    TMUs56 * 4 = 224
    Tensor Cores (第 2 代)56 * 8 = 448
    RT Cores (第 1 代)56 * 1 = 56
    ROPs64
    • 基础频率 1065 MHz ~ 加速频率 1395 MHz
    • 一级缓存:每 SM 64 KB
    • 二级缓存:共享 6 MB
    • 显存:16 GB GDDR6 256 bit 1575 MHz (等效带宽 403.2 GB/s)
  • 理论性能

    • FP16 (half):20 TFLOPS (2:1)
    • FP32 (float):10 TFLOPS
    • FP64 (double):312.5 FLOPS (1:32)
  • 特性支持

    • CUDA:7.5
    • NVIDIA 编码器(NVENC):第 7 代
    • NVIDIA 解码器(NVDEC):第 4 代
  • 参考性能(以 100% 为基准)

    型号性能(百分比)备注
    GeForce GT 103012%亮机
    GeForce GTX 750 Ti18%亮机
    GeForce GTX 1060 6 GB48%(N-1 代) Pascal 架构
    GeForce RTX 3060 12 GB89%(N+1 代) Ampere 架构
    GeForce GTX 1080 Ti98%(N-1 代) Pascal 架构
    GeForce RTX 2070 SUPER99%同架构
    GeForce RTX 4060106%(N+2 代) Ada Lovelace 架构
    GeForce 3060 Ti114%(N+1 代) Ampere 架构
    GeForce RTX 4060 Ti127%(N+2 代) Ada Lovelace 架构
    GeForce RTX 2080 Ti128%同架构

重头戏来了,主要就是为了这碟醋包的饺子——2025 年初大船靠岸的洋垃圾,来自 NVIDIA 云端游戏服务器,和 Intel CC150 处理器搭配的 Tesla T10 显卡。其采用与 RTX 2080 Ti 和 TITAN RTX 同款的 TU102 核心,启用了 56 / 72 = 77.78% 的 SM。最大亮点在于 16 GB 256 bit 的显存,凭借着大带宽,在显存密集型应用的表现能追赶 2 倍价格的 RTX 4060 Ti 16 GB。

游戏方面,显卡本身没有视频输出接口,需借助核显输出画面。游戏性能接近 RTX 2070 SUPER 和 RTX 4060。

功耗表现方面,150 W 虽然比不了 RTX 4060(115 W)和 Tesla T4(75 W),但对比同架构性能接近的 RTX 2070 SUPER(215 W),能耗比还不错。可以手动限制功耗墙,最低 100 W。

虽然这块显卡没有风扇,但能用 RTX 2080 Ti 的涡轮散热器改装散热。需要的东西有导热垫、硅脂、足够长的 4-pin 风扇延长线(建议 30 cm 以上)。配套挡板可有可无,主要起固定作用。

注意

在安装前,需提前在主板 BIOS 开启 PCI Above 4G Decoding,否则无法开机。

至于驱动安装,可参考这篇文章:Tesla T10显卡指南 - 丶末宝

其他配件

电源对于服务器和 NAS 很重要,7 x 24 小时运行,凑合不得。 用的旧服务器上的 450 W 铜牌电源,主要看中其几乎无噪音的优点,而新买的航嘉 WD500K 风扇噪音就明显大一些。待机功耗优化方面,用 DC 电源能降低好几瓦,但没敢选,实在是怕不稳定;ATX 电源由于低负载时转换效率不佳,低瓦数电源可能比高瓦数电源更省电,不过实在是找不到又新又好的小瓦数 ATX 电源了,只能作罢。

散热器随便买了个下压式的,够用。

硬盘直接换到新机器上,一块小 MLC 当系统盘,一块大 TLC 当存储盘,不用机械。

注意

旧硬盘若使用 Lecacy 启动,需要在主板 BIOS 中开启 CSM(兼容支持模块),否则识别不到启动选项。

机箱按显卡散热器长度加个几厘米来选就行了,显卡供电口在尾部,要留一点空间。

小结

说是升级,但大部分配件都换新了,相当于装了台新机,但比常规装机省了屏幕钱。

时效性提醒

本节以下内容总结于 2025 年 4 月。

项目型号价格备注
CPUAMD Ryzen 3 PRO 5350GE¥5284 核不太值这价
主板ASUS PRIME A520M-K¥220二手
内存ADATA ECC DDR4 2666 Mhz 16 G * 1¥165小贵
GPUNVIDIA Tesla T10 + 散热器¥1390 + ¥97散热略贵
散热器¥52
机箱¥74
总计¥2400可以接受

不过为了组装,还买了一个电源和各种线材,总预算 ¥3000 以内吧,中端手机价格水平。

Tesla T10 散热风扇设置

在改装换用 RTX 2080 Ti 涡轮散热器后,由于显卡 PCB 上没有风扇接口,只能把涡轮风扇的线延长,插在主板的机箱风扇接口上。这样,默认由主板 BIOS 根据 CPU 温度控制风扇的转速。

但是,若要做到显卡风扇根据自身温度自动调速,则需要额外软件的辅助。

Windows——SpeedFan

SpeedFan 不仅可以监测电压、风扇速度、温度等硬件参数,还可以修改和控制风扇速度,在 Windows 95 至 Windows 10 系统上运行良好,是款老牌软件了。其支持若干款硬件监测芯片,经测试其对 A520M-K 支持良好,却并不能识别笔记本的监测芯片。完整的支持列表可以在官网文章 Supported hardware monitor chips and temperature sensors 查看。

在官网的教程文章 Advanced Fan Control - Basic concepts and definitions 里详细讲述了自定义风扇控制的教程,建议仔细阅读。概括来说,分为以下几步:

  1. 在软件主界面,勾选 Automatic Fan Speed,启用软件风扇控制。
  2. Configure - Advanced 选项卡中,选择主板的监测芯片,将对应显卡风扇(如 fan1)的控制模式从 Smart Fan IV 修改为 Manual。如果不知道显卡风扇对应的编号,也可以在这一步,调整不同风扇的控制模式并观察来寻找。
  3. Configure - Fan Control 选项卡中,定义新的 Fan Controller,选择要控制的风扇、控制方法、要响应的温度并调整风扇曲线。
  4. Configure - Temperature 选项卡中,选中 GPU 温度,修改提高 Warning 温度的值。因为如果显卡温度超过此值,软件会强制将上一步设置的对应风扇转速调至 100%(直接起飞)。

作为参考,Tesla T10 核心的最大工作温度为 87 度,强制降频温度为 89 度,关闭温度为 92 度。同时,注意到 GPU-Z 监测的热点温度比核心温度还要高约 15 度(和散热器安装效果有关)。

Linux——fan2go

Linux 系统一切皆文件,因此从原理来说,可以直接修改主板监测芯片的配置值来控制显卡风扇。A520M-K 的监测芯片的内核驱动说明可以在 这个网页 查看。

fan2go 是一款控制电脑风扇的开源软件,用 Go 语言开发,依赖 lm-sensors 库,可作为 Linux 的风扇控制守护进程。Github 仓库为 markusressel/fan2go,仔细阅读并按其说明安装和配置。

fan2go 通过自定义配置文件实现自动风扇控制,添加配置文件,参考内容如下:

/etc/fan2go/fan2go.yaml
yaml
fans:
  - id: gpu
    hwmon:
      platform: nct6798
      rpmChannel: 1
      pwmChannel: 1
    neverStop: true
    curve: gpu_curve
sensors:
  - id: core_gpu
    cmd:
      exec: /usr/bin/bash
      args: [ '/etc/fan2go/sensor_core_gpu.sh' ]
curves:
  - id: gpu_curve
    linear:
      sensor: core_gpu
      steps:
        - 30: 0
        - 35: 10
        - 40: 16
        - 45: 35
        - 50: 40
        - 55: 45
        - 60: 55
        - 65: 60
        - 70: 90
        - 75: 110
        - 80: 130
        - 85: 150

注意不同涡轮散热器的风扇曲线可能不同,建议自行测试,并设置一个温度与噪音相平衡的曲线。其中 NVIDIA 的显卡温度无法通过设备文件直接读出,需要一个获取温度的脚本:

/etc/fan2go/sensor_core_gpu.sh
sh
echo `/usr/bin/nvidia-smi --format=csv,noheader --query-gpu=temperature.gpu`000

注意

配置文件和温度获取脚本的访问权限应为 root root 600,以防止可能的篡改利用。

按说明文档,在 /usr/lib/systemd/system/ 添加 fan2go.service 文件并启用。第一次运行时,fan2go 会测量显卡风扇的转速曲线,时间约几分钟,风扇会逐步从静止到全速,直至测量完成。

无负载情况下风扇很安静,高负载时风扇转速约 2000 RPM,核心温度控制在 70 度以下,噪音处于一个可以接受的水平,不会很大。

功耗和温度测试

以下“整机功耗”均为接线板测量功耗,仅安装了 1 个 M.2 SATA 硬盘。

3DMark Time Spy 压力测试

限制 GPU 功耗墙至 120 W,以降低温度和风扇噪音。

此时整机功耗约 170 W,显卡核心温度 65 度,核心热点温度 80 度。

若取消 GPU 功耗墙,整机功耗约为 200 W

Windows 10 桌面待机

整机功耗约 34 W,其中外接屏幕带来的功耗约 1 W,使用了 USB 网络共享导致耗电 2~3 W。

去除杂项后整机功耗估计约 30 W。

Linux 无负载待机(无外设)

整机功耗 28~29 W,其中 NVIDIA 驱动显示显卡待机功耗 11 W,s-tui 显示 CPU Package 功耗约 6 W。

省电优化

服务器一年 365 天不间断运行,还是要考虑一下电费的。

对于 Linux 系统服务器,功耗优化有三方面:显卡驱动、软件、BIOS。

  1. 启用显卡持久模式,运行 sudo nvidia-smi -pm 1 命令即可降低显卡待机功耗。
  2. 安装 powertop 软件,运行 sudo powertop --auto-tune 命令,可以将上一节中 Linux 无负载待机功耗降低至 26 W。
  3. BIOS 可以调整的项还是不少的,鉴于机器不在手边,就暂时没法一一总结了。

软件优化会在系统重启后失效,简单的办法是添加 root 用户的定时任务。执行 sudo crontab -e 命令,将 @reboot sleep 20; nvidia-smi -pm 1 && powertop --auto-tune 添加到文件末尾,即可在每次开机 / 重启后 20 秒自动执行优化命令。

到这里可能有人会有疑问——要是想极致省电,拔掉显卡能不能达到 20 W 以内呢?虽然忘记当时做没做过测试了,但前面也提到过 ATX 电源的能效问题,功耗越低,电源转换效率越低,节省的量不会有 11 W 那么多。

总而言之,日常显卡空闲,且 CPU 低负载时,再算上一两块 SATA 固态,是可以期望待机功耗在 30 W 左右的。

总结

从硬件选择,再到装机、测试、优化,实在是花了好一番工夫(包括写这篇总结),感觉无用的知识又增加了不少。感谢各开源软件的贡献者,也感谢整个过程中查阅到的博客的博主们。

最后感叹一下科技的进步,希望再过几年能捡的东西表现更上一层楼。

最后修改于: