这篇文章是我对LLM时代下的工作流做的一次思想实验.

首先明确一下共同语境, 日常工作的目的就是去解决特定问题. 要去解决问题可能需要物理空间上的移动, 比如网约车, 开会, 摆摊. 也可能不需要. LLM是个很强大的"工具". 通过提问可以获得答案. 不同程度的LLM能给出来的答案质量也不同. 假设GPT5真的能达到博士水平. 那么有没有可能一个八岁小孩可以解决专家才能解决的问题呢? 或者说, 在不需要创造力的工作语境下, 可以解决大部分普通的工作内容呢?

现在让我们站在LLM的角度下, LLM只能接受提示词(提问). 而小孩和专家的区别, 在于提出的问题质量. 专家由于有足够的先验, 一般是不需要提问的, 并且提问的深度肯定越超八岁小孩. 八岁小孩由于没有先验知识和经验, 所以只能通过提问的方式获得答案. 如果一个小孩可以和专家提出一样的问题, 那么对于LLM来说小孩和专家也是一样的. 一个问题可以由一系列的提问得到解决方案. 而小孩可以提出这一系列问题的话, 小孩就能够解决专家能解决的问题. (假设问题不需要高超的物理空间上的移动, 比如运动员, 飞行员等)

所以如何让小孩提出这一系列的问题呢? 核心思想是范围缩减.

Step1. 描述当前场景所要解决的问题. 让LLM提供大致的解决方案.

Step2.1. 假如LLM给出的大致的解决方案脱离了当前场景, 没有实际意义的话. 补充当前场景的先验描述. 重新提问. 进入到Step2.2

Step2.2. 遍历LLM提供大致的解决方案, 进行步骤拆解

Step3. 对于给定的步骤, 如果不能action的话, 提问LLM直到能够action为止.

Step4. 如果Step3给出来的步骤不能action, 说明缺少先验证描述. 补充当前场景的先验描述. 重新提问. 进入到Step2.1

Step5. 对Step3给出的步骤进行action. 问题解决.

相当于人是LLM的agent. 这时候LLM相当于人的大脑. 而提问就是交互方式. 很明显小孩需要提非常非常多的问题才能够完成任务, 在时间有限的条件下, 效率还是非常低的.