很多研究者把 LLM 用在文献综述上时,第一步就错了:他们要求模型直接给出“综述成稿”,却没有先把论文拆成可检索、可比较、可质疑的工作单元。
为什么大多数综述在第一轮就失真
一段对话式总结往往会把论文的识别假设、样本口径和数据限制揉在一起。你读起来像是获得了全局理解,实际上只是得到了一层模糊叙事。
经济学研究真正需要的是结构:谁在研究什么问题,使用什么识别方法,依赖什么数据条件,结论在哪些边界下成立。这些字段不拆开,后面就无法进入设计与复现阶段。
四层代理如何接力
第一层是 Reader,只负责把论文拆成标准卡片;第二层是 Mapper,把这些卡片按主题、识别方法和数据来源挂到同一个索引里;第三层是 Skeptic,专门指出证据链断点;第四层是 Synthesizer,再基于前面三层的产出写综述。
- Reader 输出 claim、data、method、sample 和 limitation 五个必填字段。
- Mapper 建立跨论文的对照表,而不是单篇摘要。
- Skeptic 只回答一个问题:这条结论在哪一步最脆弱。
- Synthesizer 最后写成稿,因此成稿天然带证据索引。
应该追踪的三个运营指标
不要只看节省了多少小时。更关键的是:文献卡片的复用率、识别策略冲突的发现率,以及从综述到回归脚本的转化率。
一旦这些指标稳定,综述就不再是一次性写作任务,而是研究组的长期资产。