Search K
主题
主题
最初的契机是想换电脑了,手里只有一台 2020 年买的轻薄本,玩不了什么 3D 游戏,部署本地 AI 什么的也基本无缘。板载 16 G 内存由于核显和 CPU 共用,也有点捉襟见肘。纠结了半天是买新笔记本还是组装台式机,最后灵机一动,决定不如把个人服务器升级一下。
毕竟,手里的笔记本功能完好,本着物尽其用的理念接着用。
买新笔记本的话,需要好几千块预算不说,换下来的也卖不了多少钱,多半吃灰浪费,感觉划不来。而装台式机和笔记本搭配的方案,一来台式机移动不方便,平时需要来回跑,就只能在一个地方用;二来除显卡外会冗余一套配件,因为日常使用并不需要第二个相同的系统和为了运行它的第二颗 CPU。
而升级服务器的话,配置一块 GPU,游戏跑在服务器上,用笔记本能随时随地远程串流玩游戏。此外还可以部署一些 AI 应用,手机也能随时访问。
扯了半天,理想很美好,现实先试试。服务器原来的 CPU 还是低功耗双核 E3。十多年前的配置实在是过时了,二手市场一套加起来卖可能还没电源贵,丢掉都几乎没什么心理负担。
在挑选 CPU 时,主要考虑了三点:
其实还有 6 核的 5650GE 和 8 核的 5750GE,然而因为是拆机货,找不到卖家无奈选择了这款。性能方面可以类比 2024/2025 年入门处理器 Intel Core i3 12100。
对比类似的 B450 主板,因为 E 后缀的 AMD 处理器不支持超频,主板的最大亮点完全用不上;此外是扩展能力的差异,A520 提供 4 条 PCIe 3.0,B450 提供 6 条 PCIe 2.0,其实差距不大。再对比 B550 主板,Cezanne 系列处理器仅支持 PCIe 3.0,更加昂贵的 B550 提供的 PCIe 4.0 功能也无法利用。
在具体型号选择上,主要考虑了华硕主板支持 ECC 内存的特性。A520M-K 比较常见,相比 M-A 少了 2 个内存插槽,但比 M-R 多一个 PCIe 3.0 x1 插槽。
此外还要吐槽一点:比起服务器级主板,消费级主板提供的额外功能很少。这块入门级主板各种外围配置的级别也完全比不上旧的 Asus P8B-X 服务器主板(C202 芯片组),且没有诊断灯、蜂鸣器,难以判断硬件哪里出了问题。组装时一开始没点亮,以为哪里翻车了,又因为没有备用配件,排查了老半天,最后还是自己查主板说明书才发现原因是内存不兼容。
ADATA ECC DDR4 2666 Mhz 16 G * 1
DDR4 ECC 内存的校验特性能消除内存位意外翻转造成的影响,提高系统稳定性。
缺点是频率不高(高的比较贵,服务器用这个够了),单通道吞吐量打对折,导致核显性能降低。
注意
消费级主板大多仅支持 Unbuffered 内存,即“纯 ECC”,使用 REG ECC 内存无法开机。
发布时间:2020
架构:Turing (TU102)
制程:12 nm
TDP:150 W(1 x 8-pin 供电)
规格
硬件单元 | 共 56 组 SM |
---|---|
Shading Units | 56 * 64 = 3584 |
TMUs | 56 * 4 = 224 |
Tensor Cores (第 2 代) | 56 * 8 = 448 |
RT Cores (第 1 代) | 56 * 1 = 56 |
ROPs | 64 |
理论性能
特性支持
参考性能(以 100% 为基准)
型号 | 性能(百分比) | 备注 |
---|---|---|
GeForce GT 1030 | 12% | 亮机 |
GeForce GTX 750 Ti | 18% | 亮机 |
GeForce GTX 1060 6 GB | 48% | (N-1 代) Pascal 架构 |
GeForce RTX 3060 12 GB | 89% | (N+1 代) Ampere 架构 |
GeForce GTX 1080 Ti | 98% | (N-1 代) Pascal 架构 |
GeForce RTX 2070 SUPER | 99% | 同架构 |
GeForce RTX 4060 | 106% | (N+2 代) Ada Lovelace 架构 |
GeForce 3060 Ti | 114% | (N+1 代) Ampere 架构 |
GeForce RTX 4060 Ti | 127% | (N+2 代) Ada Lovelace 架构 |
GeForce RTX 2080 Ti | 128% | 同架构 |
重头戏来了,主要就是为了这碟醋包的饺子——2025 年初大船靠岸的洋垃圾,来自 NVIDIA 云端游戏服务器,和 Intel CC150 处理器搭配的 Tesla T10 显卡。其采用与 RTX 2080 Ti 和 TITAN RTX 同款的 TU102 核心,启用了 56 / 72 = 77.78% 的 SM。最大亮点在于 16 GB 256 bit 的显存,凭借着大带宽,在显存密集型应用的表现能追赶 2 倍价格的 RTX 4060 Ti 16 GB。
游戏方面,显卡本身没有视频输出接口,需借助核显输出画面。游戏性能接近 RTX 2070 SUPER 和 RTX 4060。
功耗表现方面,150 W 虽然比不了 RTX 4060(115 W)和 Tesla T4(75 W),但对比同架构性能接近的 RTX 2070 SUPER(215 W),能耗比还不错。可以手动限制功耗墙,最低 100 W。
虽然这块显卡没有风扇,但能用 RTX 2080 Ti 的涡轮散热器改装散热。需要的东西有导热垫、硅脂、足够长的 4-pin 风扇延长线(建议 30 cm 以上)。配套挡板可有可无,主要起固定作用。
注意
在安装前,需提前在主板 BIOS 开启 PCI Above 4G Decoding,否则无法开机。
至于驱动安装,可参考这篇文章:Tesla T10显卡指南 - 丶末宝
电源对于服务器和 NAS 很重要,7 x 24 小时运行,凑合不得。 用的旧服务器上的 450 W 铜牌电源,主要看中其几乎无噪音的优点,而新买的航嘉 WD500K 风扇噪音就明显大一些。待机功耗优化方面,用 DC 电源能降低好几瓦,但没敢选,实在是怕不稳定;ATX 电源由于低负载时转换效率不佳,低瓦数电源可能比高瓦数电源更省电,不过实在是找不到又新又好的小瓦数 ATX 电源了,只能作罢。
散热器随便买了个下压式的,够用。
硬盘直接换到新机器上,一块小 MLC 当系统盘,一块大 TLC 当存储盘,不用机械。
注意
旧硬盘若使用 Lecacy 启动,需要在主板 BIOS 中开启 CSM(兼容支持模块),否则识别不到启动选项。
机箱按显卡散热器长度加个几厘米来选就行了,显卡供电口在尾部,要留一点空间。
说是升级,但大部分配件都换新了,相当于装了台新机,但比常规装机省了屏幕钱。
时效性提醒
本节以下内容总结于 2025 年 4 月。
项目 | 型号 | 价格 | 备注 |
---|---|---|---|
CPU | AMD Ryzen 3 PRO 5350GE | ¥528 | 4 核不太值这价 |
主板 | ASUS PRIME A520M-K | ¥220 | 二手 |
内存 | ADATA ECC DDR4 2666 Mhz 16 G * 1 | ¥165 | 小贵 |
GPU | NVIDIA Tesla T10 + 散热器 | ¥1390 + ¥97 | 散热略贵 |
散热器 | ¥52 | ||
机箱 | ¥74 | ||
总计 | ¥2400 | 可以接受 |
不过为了组装,还买了一个电源和各种线材,总预算 ¥3000 以内吧,中端手机价格水平。
在改装换用 RTX 2080 Ti 涡轮散热器后,由于显卡 PCB 上没有风扇接口,只能把涡轮风扇的线延长,插在主板的机箱风扇接口上。这样,默认由主板 BIOS 根据 CPU 温度控制风扇的转速。
但是,若要做到显卡风扇根据自身温度自动调速,则需要额外软件的辅助。
SpeedFan 不仅可以监测电压、风扇速度、温度等硬件参数,还可以修改和控制风扇速度,在 Windows 95 至 Windows 10 系统上运行良好,是款老牌软件了。其支持若干款硬件监测芯片,经测试其对 A520M-K 支持良好,却并不能识别笔记本的监测芯片。完整的支持列表可以在官网文章 Supported hardware monitor chips and temperature sensors 查看。
在官网的教程文章 Advanced Fan Control - Basic concepts and definitions 里详细讲述了自定义风扇控制的教程,建议仔细阅读。概括来说,分为以下几步:
Smart Fan IV
修改为 Manual
。如果不知道显卡风扇对应的编号,也可以在这一步,调整不同风扇的控制模式并观察来寻找。作为参考,Tesla T10 核心的最大工作温度为 87 度,强制降频温度为 89 度,关闭温度为 92 度。同时,注意到 GPU-Z 监测的热点温度比核心温度还要高约 15 度(和散热器安装效果有关)。
Linux 系统一切皆文件,因此从原理来说,可以直接修改主板监测芯片的配置值来控制显卡风扇。A520M-K 的监测芯片的内核驱动说明可以在 这个网页 查看。
fan2go 是一款控制电脑风扇的开源软件,用 Go 语言开发,依赖 lm-sensors 库,可作为 Linux 的风扇控制守护进程。Github 仓库为 markusressel/fan2go,仔细阅读并按其说明安装和配置。
fan2go 通过自定义配置文件实现自动风扇控制,添加配置文件,参考内容如下:
fans:
- id: gpu
hwmon:
platform: nct6798
rpmChannel: 1
pwmChannel: 1
neverStop: true
curve: gpu_curve
sensors:
- id: core_gpu
cmd:
exec: /usr/bin/bash
args: [ '/etc/fan2go/sensor_core_gpu.sh' ]
curves:
- id: gpu_curve
linear:
sensor: core_gpu
steps:
- 30: 0
- 35: 10
- 40: 16
- 45: 35
- 50: 40
- 55: 45
- 60: 55
- 65: 60
- 70: 90
- 75: 110
- 80: 130
- 85: 150
注意不同涡轮散热器的风扇曲线可能不同,建议自行测试,并设置一个温度与噪音相平衡的曲线。其中 NVIDIA 的显卡温度无法通过设备文件直接读出,需要一个获取温度的脚本:
echo `/usr/bin/nvidia-smi --format=csv,noheader --query-gpu=temperature.gpu`000
注意
配置文件和温度获取脚本的访问权限应为 root root 600
,以防止可能的篡改利用。
按说明文档,在 /usr/lib/systemd/system/
添加 fan2go.service
文件并启用。第一次运行时,fan2go 会测量显卡风扇的转速曲线,时间约几分钟,风扇会逐步从静止到全速,直至测量完成。
无负载情况下风扇很安静,高负载时风扇转速约 2000 RPM,核心温度控制在 70 度以下,噪音处于一个可以接受的水平,不会很大。
以下“整机功耗”均为接线板测量功耗,仅安装了 1 个 M.2 SATA 硬盘。
限制 GPU 功耗墙至 120 W,以降低温度和风扇噪音。
此时整机功耗约 170 W,显卡核心温度 65 度,核心热点温度 80 度。
若取消 GPU 功耗墙,整机功耗约为 200 W。
整机功耗约 34 W,其中外接屏幕带来的功耗约 1 W,使用了 USB 网络共享导致耗电 2~3 W。
去除杂项后整机功耗估计约 30 W。
整机功耗 28~29 W,其中 NVIDIA 驱动显示显卡待机功耗 11 W,s-tui 显示 CPU Package 功耗约 6 W。
服务器一年 365 天不间断运行,还是要考虑一下电费的。
对于 Linux 系统服务器,功耗优化有三方面:显卡驱动、软件、BIOS。
sudo nvidia-smi -pm 1
命令即可降低显卡待机功耗。sudo powertop --auto-tune
命令,可以将上一节中 Linux 无负载待机功耗降低至 26 W。软件优化会在系统重启后失效,简单的办法是添加 root 用户的定时任务。执行 sudo crontab -e
命令,将 @reboot sleep 20; nvidia-smi -pm 1 && powertop --auto-tune
添加到文件末尾,即可在每次开机 / 重启后 20 秒自动执行优化命令。
到这里可能有人会有疑问——要是想极致省电,拔掉显卡能不能达到 20 W 以内呢?虽然忘记当时做没做过测试了,但前面也提到过 ATX 电源的能效问题,功耗越低,电源转换效率越低,节省的量不会有 11 W 那么多。
总而言之,日常显卡空闲,且 CPU 低负载时,再算上一两块 SATA 固态,是可以期望待机功耗在 30 W 左右的。
从硬件选择,再到装机、测试、优化,实在是花了好一番工夫(包括写这篇总结),感觉无用的知识又增加了不少。感谢各开源软件的贡献者,也感谢整个过程中查阅到的博客的博主们。
最后感叹一下科技的进步,希望再过几年能捡的东西表现更上一层楼。