从 PDF 到 Panel：经济学文献综述的四代理工作流

当文献综述不再只是找论文，而是把论文、识别策略、数据口径和可复现代码同时放进同一条流水线，研究效率才真正开始提升。

4

代理层

1

统一语境

0

重复整理

研究工作流/2026年3月28日/12 分钟

研究流程编辑

EconAgora Editorial Desk

专栏索引

01

把阅读、归档、质疑、写作拆成四个连续角色，而不是一段长提示词。

02

每一层都输出结构化资产，下一层只消费可验证的中间结果。

03

评价文献综述的标准不是摘要像不像人写，而是后续回归设计能不能直接用。

很多研究者把 LLM 用在文献综述上时，第一步就错了：他们要求模型直接给出“综述成稿”，却没有先把论文拆成可检索、可比较、可质疑的工作单元。

为什么大多数综述在第一轮就失真

一段对话式总结往往会把论文的识别假设、样本口径和数据限制揉在一起。你读起来像是获得了全局理解，实际上只是得到了一层模糊叙事。

经济学研究真正需要的是结构：谁在研究什么问题，使用什么识别方法，依赖什么数据条件，结论在哪些边界下成立。这些字段不拆开，后面就无法进入设计与复现阶段。

第一层是 Reader，只负责把论文拆成标准卡片；第二层是 Mapper，把这些卡片按主题、识别方法和数据来源挂到同一个索引里；第三层是 Skeptic，专门指出证据链断点；第四层是 Synthesizer，再基于前面三层的产出写综述。

不要只看节省了多少小时。更关键的是：文献卡片的复用率、识别策略冲突的发现率，以及从综述到回归脚本的转化率。

一旦这些指标稳定，综述就不再是一次性写作任务，而是研究组的长期资产。

继续抽一本

同一书架上的其他专栏，继续沿着研究系统、复现和 agent 工作流往下读。

真正拖垮复现项目的，往往不是估计量本身，而是文件命名、变量字典、版本漂移和路径管理这些被低估的工程细节。

LLM 可以快速提出看上去合理的识别方案，但真正的问题不在“方案能否说得通”，而在“方案是否经得起可证伪的审计”。

把研究 Copilot 直接理解成一个聊天窗口会很快碰到天花板。更稳定的做法，是把提示策略、领域技能和工具接入拆成三层可替换架构。