摘要:前几天收到粉丝私信,说照着教程把旧电脑改成服务器,结果折腾了 3 天还是没成功 —— 要么是启动后连不上网,要么是跑两天就自动关机。其实我第一次改的时候也踩了不少坑,光是让旧电脑稳定运行,就重装了 6 次系统。...
前几天收到粉丝私信,说照着教程把旧电脑改成服务器,结果折腾了 3 天还是没成功 —— 要么是启动后连不上网,要么是跑两天就自动关机。
其实我第一次改的时候也踩了不少坑,光是让旧电脑稳定运行,就重装了 6 次系统。今天把这些血的教训整理成避坑指南,每个坑都附详细解决步骤和实测效果,照着做能让你少走 90% 的弯路。
坑一:电脑太旧,根本跑不起来
有个粉丝拿 10 年前的笔记本折腾,2GB 内存 + 单核 CPU,装个系统都要两小时,最后还说教程没用。
判断标准:低于这配置的别浪费时间:
内存:最少 4GB(实测 2GB 能启动但会频繁卡死)CPU:双核以上(单核跑服务器会一直卡在启动页)硬盘:机械硬盘必须没坏道(用 HD Tune 测,有红块的直接放弃)解决办法:
加内存:旧笔记本一般有两个内存插槽,8GB DDR3 才 50 块钱,效果立竿见影换固态:把原来的机械硬盘换成 120GB 固态,启动速度从 5 分钟变 30 秒坑二:装错系统,白浪费一天时间
很多人直接装了带图形界面的 Windows,结果 8GB 内存被系统占了一半,根本没空间跑服务。
正确做法:
认准 Ubuntu Server(没图形界面,省 30% 内存)版本选 20.04 LTS(别用最新版,兼容性差)安装时必须勾上 “OpenSSH Server”(没勾的话,后面远程连不上)补救措施:
如果已经装了带图形界面的系统,用这条命令删掉:
# 卸载图形界面,释放内存sudo apt purge ubuntu-desktop -y
sudo apt autoremove -y
sudo systemctl set-default multi-user.target # 默认进入命令行模式
坑三:加入集群后老掉线,查不出原因
这是最让人崩溃的坑 —— 明明显示加入成功,过半小时就掉了,日志里全是 “connection refused”。
90% 的原因在这:
用了 Wi-Fi 连接(服务器必须插网线,Wi-Fi 信号波动会导致心跳失败)电源管理没关(旧电脑会自动休眠,表面看没关机,实际断网了)解决步骤:
强制用网线连接,在路由器里给旧电脑绑个固定 IP(避免 IP 变动)彻底关闭电源管理:# 关闭所有节能模式sudo systemctl mask sleep.target suspend.target hibernate.target hybrid-sleep.target
# 确保合上盖子不休眠(服务器需要24小时醒着)
sudo sed -i s/#HandleLidSwitch=ignore/HandleLidSwitch=ignore/ /etc/systemd/logind.conf
sudo systemctl restart systemd-logind
坑四:硬盘空间满了,服务突然崩了
有次半夜模型训练到 90%,突然报错 “磁盘空间不足”,查了才发现是日志占满了硬盘 —— 旧电脑的 500GB 机械硬盘,被系统日志占了 400GB。
预防措施:
装系统时给根分区留至少 50GB(别全分给 /home)设置日志自动清理:# 创建日志清理脚本cat > /home/clean_logs.sh << EOF
#!/bin/bash
# 只保留7天内的日志
find /var/log -type f -mtime +7 -delete
# 清理Docker缓存
docker system prune -f
EOF
# 加执行权限
chmod +x /home/clean_logs.sh
# 设置每天凌晨自动运行
crontab -l > temp_cron
echo "0 3 * * * /home/clean_logs.sh" >> temp_cron
crontab temp_cron
rm temp_cron
坑五:散热不行,电脑自动关机
旧电脑散热差,跑模型训练两小时就发烫,然后突然关机。有个粉丝没注意,结果训练到 90% 的数据全丢了。
简单有效的散热方案:
垫散热架(10 块钱的就行,能降 5-10 度)拆开清灰(用吹风机冷风吹,别用湿布擦)禁用 CPU 睿频(虽然慢点但更稳定):# 临时禁用睿频echo 1 | sudo tee /sys/devices/system/cpu/intel_pstate/no_turbo
# 永久禁用(重启生效)
sudo echo "echo 1 > /sys/devices/system/cpu/intel_pstate/no_turbo" >> /etc/rc.local
监控温度:
装个传感器实时看着,超过 80 度就手动停掉任务:
# 安装温度监控工具sudo apt install lm-sensors
# 检测传感器
sudo sensors-detect
# 查看温度
sensors
坑六:权限设置太随意,数据丢了找不回
有个粉丝图省事,全程用 root 用户操作,结果误删了整个模型文件夹,哭着问我能不能恢复。
正确做法:
新建普通用户,给必要权限就行:# 创建用户sudo adduser serveruser
# 给sudo权限
sudo usermod -aG sudo serveruser
重要数据定期备份到 U 盘:# 写个备份脚本sudo cp -r /home/serveruser/models /media/usb_backup/$(date +%Y%m%d)
禁止 root 用户直接登录 SSH:sudo vim /etc/ssh/sshd_config# 改成 PermitRootLogin no
sudo systemctl restart sshd
旧电脑服务器检查清单
改完后对照这张表检查,能避免 80% 的后续问题:
检查项
合格标准
不合格处理
内存占用
空闲 > 1GB
关闭没用的服务
硬盘空间
剩余 > 20GB
清理日志和旧镜像
网络延迟
<5ms(局域网)
换网线,远离微波炉等干扰源
温度
<75 度
加强散热或降频
稳定性
连续 24 小时不掉线
检查电源和系统日志
旧电脑改服务器本来就是低成本方案,别指望完美运行。我的经验是:能稳定跑离线任务就行,别强求它像云服务器一样流畅。
如果你的旧电脑折腾多次还是不行,也别灰心 —— 就当学技术练手了,实在不行买个二手迷你主机(比如占美 N5105),性能比旧笔记本强 10 倍。
你改旧电脑时踩过什么奇葩的坑?评论区聊聊。
(关注我,明天教你怎么用树莓派扩展服务器集群。)