blog

使用Coding Agent 作为通用智能体完成 DeepResearch 任务

Author: ninehills
Labels: blog
Created: 2025-09-16T09:24:54Z
Link and comments: https://github.com/ninehills/blog/issues/141

CLI Agent 是文本模态 Agent 的天然形态,比如 Manus,其本质就是在 VM 执行的 CLI Agent。 在 VLLM 不成熟的今天,我们需要先实现文本模态的 Agent。

尝试用 Gemini CLI 实现 DeepReasearch 任务,复现 Prompt 如下。

效果:使用 gemini-2.5-flash 模型,相比于 Gemini DR,效果要好得多。(但是目前的引用管理不太好)

请严格按照深度研究步骤,产出如对应主题调研报告。需要广泛的搜集信息,包括使用中文和英文关键词搜索,搜索学术论文和新闻报告等。

## 要求

- 所有临时文件,保存本地目录。
- 将所有的研究计划,以 Markdown TODO list 的方式保存在 TODO.md 文件中。

## 研究主题

针对 GraphRAG 主题,找到2025年的全部论文,深入读取论文内容,给出完整综述。

## 深度研究步骤

准备阶段:
(1)创建 TODO.md 文件,保存所有待办步骤到 TODO.md 中,每个任务完成后反思和更新计划。

第一阶段:信息搜集和研究大纲生成
(1)信息搜索:收集相关领域的信息,明确研究背景、细化通过研究想要达成的具体成果
(2)生成研究大纲,写入到 `research_outline.md` 文件

第二阶段:进行深度信息收集
(1)系统手机目标领域的历史数据和案例,将这些信息整理成标准化的内容,可选择用数据表格形态整理。关键是确保数据的完整性、准确性和时序性,为后续所有分析提供可靠的事实基础,数据收集必须覆盖足够的时间范围,包含所有相关的关键信息字段
(2)请广泛的进行信息收集,需要收集 100 条以上的参考文献。
(3)将所有的参考论文、网页等URL保存到 `reference.md` 文件中,使用Markdown表格存储,如果为PDF格式论文,将所有论文下载到本地(可以先生成URL列表后用 wget批量下载)。

第三阶段:深度分析与信息深度挖掘
(1)深度模式分析:基于收集到的数据,深入分析其中的新研究对象、关键模式、规律和趋势等。这包括频率统计、周期性变化、发展趋势等量化分析,目标是揭示隐藏在数据背后的内在逻辑和规律性特征。对于上一步中出现的新的重要概念或实体,需对该类需要探究的内容进行二次信息搜集。分析结果尽可能用统计数据和可视化图表来呈现。
(2)核心驱动因素提取:通过对模式的深度分析,需要识别出真正影响结果的核心驱动因素。这些因素需要按照影响力大小进行排序,并评估各自的权重。重点是找到那些具有决定性作用的关键变量,而不是表面的相关性因素。
(3)现实背景信息补强:针对已识别的核心驱动因素,我会收集当前相关的现实背景信息。这包括最新的政策变化、市场环境、技术发展、社会趋势等可能影响分析结果的现实因素。目标是将历史规律与当前实际情况相结合,确保分析的时效性和准确性。
(4)在这个阶段中,随时判断已有信息是否足够,应尽可能的收集更多的信息,让参考文献越多越好。

第四阶段:输出研究报告
(1)研究报告大纲生成:根据收集的全部信息,生成报告大纲(约10个章节),并写入文件 `research_report_outline.md`
(2)研究报告分章节生成:逐个章节编写报告内容,每个章节内容写到到文件 `research_report_章节.md`
(3)研究报告合并:使用shell命令将所有章节内容合并到文件 `research_final_report.md`## 报告格式要求

1. 总文本量不低于 50000 字,使用中文。
2. 使用 Markdown格式。
3. 必须使用 markdown表格、mermaid 图表的方式表达复杂概念和内容。
4. 报告最后是专门的引用章节,有所有引用的参考文献,格式为 `[1] 参考文献1`