大语言模型(LLM)学习路径和资料汇总
Author: ninehills
Labels: blog
Created: 2023-06-27T13:42:33Z
Link and comments: https://github.com/ninehills/blog/issues/97
更新时间:20241018
0x00 学习路径
本文分为三个章节,各章节的学习目标如下。
- 入门篇:
- 了解大语言模型的基础知识和常见术语。
- 学会使用编程语言访问 OpenAI API 等常见大语言模型接口。
- 面向非专业背景的大模型普及知识。
- 应用篇:
- 可以在本地环境搭建开源模型的推理环境。
- 大语言模型应用开发框架(如 LangChain、Dify等)。
- Prompt 工程、 RAG、Agent 等大模型应用开发范式。
- 深入篇:
- 大模型技术原理、训练微调、数据工程、推理优化等。
- 大模型应用范式(RAG、Agent等)前沿进展。
读者可以根据自己需要选择对应的章节,如对大语言模型的原理不感兴趣,可只关注入门篇和应用篇。
考虑到阅读背景,本文尽可能提供中文资料或有中文翻译的资料。
标记为【必看】的是我认为只要你对这个主题感兴趣,必须要看的资料。
0x10 入门篇
在入门之前,请申请 OpenAI API,并具备良好的国际互联网访问条件。
推荐注册 https://openrouter.ai/ 可一站式访问大量闭源和开源模型。
- ChatGPT Prompt Engineering for Developers
- 虽然是 Prompt 工程,但是内容比较简单,适合入门者。
- 中英双语字幕: https://github.com/GitHubDaily/ChatGPT-Prompt-Engineering-for-Developers-in-Chinese
- OpenAI Quickstart 【必看】
- State of GPT:GPT 联合创始人做的演示,极好的总结了 GPT 的训练和应用。 【必看】
- 视频: https://www.youtube.com/watch?v=bZQun8Y4L2A
- PPT: https://karpathy.ai/stateofgpt.pdf
0x20 应用篇
0x30 深入篇
0x31 大模型技术基础方向
0x32 大模型技术原理方向
0x33 大模型训练微调方向
0x34 大模型数据工程方向
0x35 大模型推理优化方向
0x36 大模型应用方向