免费 GPU 或廉价算力

1. 显卡需求和推荐模型

使用 int4 + QLora 训练(效果并不会比Full-finetuning差多少,lora rank设置较大且应用到所有层) 8K 上下文时,显存16GB的显卡则可以训练 20B 以下模型,显存24GB的显卡则可以训练 32B(含)以下模型。

推荐微调 1-7B 模型。推荐性价比显卡:4090,计算能力和显存带宽都足够好,比L40等商业卡还好用。

2. 服务商

  • https://colab.research.google.com/
    • 【需翻墙】
    • 免费提供 T4 等显卡,显存16GB
  • https://modelscope.cn/
    • 新用户赠送 100h GPU 时间(16G、24G显卡)
  • https://aistudio.baidu.com/
    • 每日签到可以领取免费 GPU 时间,但是限制框架只能使用 Paddle
  • https://console.ebcloud.com/
    • 注册送 50元,4090显卡 2元/小时
  • https://www.autodl.com/
    • 显卡型号众多(适合测试模型在不同显卡上的性能),4090 2-3元/小时
  • https://www.suanlix.cn/
    • 4090 2-3 元/小时
    • 有香港节点,下载模型和安装环境比较方便
  • https://www.runpod.io/
    • 国外较大服务商,下载模型和安装环境比较方便
    • 4090 折约 4元/小时

3. 其他

建议开通对象存储服务(百度云、阿里云等),将打包好的 Docker 训练镜像、训练结果、数据集、工作目录等持久化到对象存储中。

国内节点配置要点:

  • pip源:https://mirrors.tuna.tsinghua.edu.cn/help/pypi/
  • conda源:https://mirrors.tuna.tsinghua.edu.cn/help/anaconda/
  • Huggingface 代理:https://hf-mirror.com/

原文发布于 GitHub Issue #133
创建于 2025-09-03T14:00:33Z,更新于 2025-09-04T10:10:26Z