Author: ninehills Labels: blog Created: 2025-01-29T04:48:48Z Link and comments: https://github.com/ninehills/blog/issues/121
随着 DeepSeek R1 的发布,如果想复刻 R1 或者在某个领域实践 RFT(Reinforcement Fine-Tuning),可以看看我整理的清单,会持续更新。 同时我个人尝试的结果也会更新上。
更新时间:2025.1.29