ReWOO：新方法使增强语言模型更高效

站长网2023-06-07 20:02:431阅

目前，增强语言模型最突出的例子是带有 Internet 浏览器或插件的ChatGPT 。得益于这些工具，ChatGPT 可以检索当前信息或可靠地解决计算任务。

ReWOO框架旨在提高此类增强模型的效率。在逻辑推理的多级基准 HotpotQA 测试中，它的准确率提高了4%，令牌消耗减少了5倍。

ReWOO 通过将语言模型的推理与对工具的访问分离来实现这一点。因此，提示中的标记只需传递给该工具一次，而不是多次。

目前，语言模型通过调用工具、传递请求、等待响应、接受响应，然后继续生成响应来访问工具。模型运行、停止、运行、停止等。这需要时间和处理能力，并且需要多次向工具发送提示令牌。

ReWOO 通过使用允许语言模型预测推理并定义响应中需要工具的位置的规划模块，使该过程更加高效。然后，该模型会生成包含所有问题和完整文本的所有子任务，即使来自工具的信息尚不可用。

粗略地说，这可以比作一个填空文本，然后一步一步用工具中的信息填充。这组作者说，大型预训练语言模型对工具响应的“形状”有足够的了解，可以进行这种预测。

因为语言模型将对工具的查询存储为子任务，并且只询问一次，然后直接询问所有问题，所以生成过程不必多次停止和重新启动。

这种工具任务的“批量”处理节省了计算能力，使增强的 LLM 更加高效。通过这种基于规划的高效工具使用，小型模型可以产生更高质量的结果。

0001

评论列表

共(0)条