首页站长资讯利用合成数据微调ChatGPT超越GPT-4摘要性能降低63%成本和提升11倍速度

利用合成数据微调ChatGPT超越GPT-4摘要性能降低63%成本和提升11倍速度

站长网2023-10-11 18:36:100阅

文章概要:

- 利用链式密度提示微调ChatGPT在新闻摘要任务上超过GPT-4零样本表现，接近GPT-4链式提示。

- 通过ScoreStringEvalChain和改进的PairwiseStringEvalChain等自动评估链实现人类水平的量化评估。

- 微调ChatGPT比GPT-4零样本快11倍且便宜63%，比GPT-4链式提示快33倍且便宜84%。

近日，Elicit公司机器学习工程师Charlie George在LangChain博客上发表文章介绍了他们使用合成数据微调ChatGPT在新闻摘要任务上超越GPT-4的研究成果。

文章提到，尽管GPT-4被公认为世界上最强大的语言模型，但其调用限制、高成本和高延迟也限制了其实际应用。为解决这一问题，一些开发者转而使用ChatGPT等小模型，但小模型的表现通常不如GPT-4。文章介绍了微调的思路，即调整模型参数以更好地适应具体任务，但收集人类标注数据昂贵且耗时，而传统评估指标如困惑度也无法准确反映用户体验。

为解决数据问题，采用了一种合成数据生成方法，即使用GPT-4通过链式密度（CoD）提示逐步改进其生成的摘要。然后，使用LangSmith平台收集这些改进后的摘要作为训练数据，微调ChatGPT。

在评估方面，文章认为传统的BLEU和ROUGE指标往往不能准确捕捉现代语言模型的细微差异。相比之下，人工评估虽可靠但耗时耗力。最佳方案是开发自动化评估系统，但也需要人工验证其有效性。研究者已经开发了与真人高度一致的自动化评估链ScoreStringEvalChain和PairwiseStringEvalChain。