一次对LLM时代下的工作流的思想实验

这篇文章是我对LLM时代下的工作流做的一次思想实验.

首先明确一下共同语境, 日常工作的目的就是去解决特定问题. 要去解决问题可能需要物理空间上的移动, 比如网约车, 开会, 摆摊. 也可能不需要. LLM是个很强大的"工具". 通过提问可以获得答案. 不同程度的LLM能给出来的答案质量也不同. 假设GPT5真的能达到博士水平. 那么有没有可能一个八岁小孩可以解决专家才能解决的问题呢? 或者说, 在不需要创造力的工作语境下, 可以解决大部分普通的工作内容呢?

现在让我们站在LLM的角度下, LLM只能接受提示词(提问). 而小孩和专家的区别, 在于提出的问题质量. 专家由于有足够的先验, 一般是不需要提问的, 并且提问的深度肯定越超八岁小孩. 八岁小孩由于没有先验知识和经验, 所以只能通过提问的方式获得答案. 如果一个小孩可以和专家提出一样的问题, 那么对于LLM来说小孩和专家也是一样的. 一个问题可以由一系列的提问得到解决方案. 而小孩可以提出这一系列问题的话, 小孩就能够解决专家能解决的问题. (假设问题不需要高超的物理空间上的移动, 比如运动员, 飞行员等)

所以如何让小孩提出这一系列的问题呢? 核心思想是范围缩减.

Step1. 描述当前场景所要解决的问题. 让LLM提供大致的解决方案.

Step2.1. 假如LLM给出的大致的解决方案脱离了当前场景, 没有实际意义的话. 补充当前场景的先验描述. 重新提问. 进入到Step2.2

Step2.2. 遍历LLM提供大致的解决方案, 进行步骤拆解

Step3. 对于给定的步骤, 如果不能action的话, 提问LLM直到能够action为止.

Step4. 如果Step3给出来的步骤不能action, 说明缺少先验证描述. 补充当前场景的先验描述. 重新提问. 进入到Step2.1

Step5. 对Step3给出的步骤进行action. 问题解决.

相当于人是LLM的agent. 这时候LLM相当于人的大脑. 而提问就是交互方式. 很明显小孩需要提非常非常多的问题才能够完成任务, 在时间有限的条件下, 效率还是非常低的.