Claude也变懒了！网友：学会给自己放假了

站长网2024-09-02 16:23:340阅

开学将至，该收心的不止有即将开启新学期的同学，可能还有 AI 大模型。

前段时间，Reddit 上挤满了吐槽 Claude 越来越懒的网友。

「它的水平下降了很多，经常停顿，甚至输出也变得很短。在发布的第一周，它可以一次性翻译整整4页文稿，现在连半页都输出不了了!」

https://www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/

在一个名为「对 Claude 彻底失望了的帖子里」，满满地摘录了 Claude「偷懒」的「十五大罪状」。

引得 Claude 的首席信息安全官 Jason Clinton 出来回复:「Claude 的水平没有下降啊!」

他表示:「我们的模型存储在一个不会改变的静态文件中，这个文件被加载到很多服务器上，每个服务器运行的都是相同的模型和软件。我们没有更改任何设置，因此模型的表现应该没有变化。如果您发现有问题，可以给回答点踩来反馈。目前，点踩数并未增加，使用 Claude API 的客户也没有类似的反馈。」

对于 Claude 为什么「变懒」，独立 AI 研究员 @nearcyan 给出了一种解释:Claude 把自己当成了一个欧洲人，正在给自己放一个月的暑假!虽然听起来有够离谱，但他给出了一连串的证据:

https://twitter.com/nearcyan/status/1829674215492161569

新的系统提示词

首先，Claude 在7月12日发布了新的系统提示词。系统提示词相当于 Claude 的背景知识，Claude 在回复用户的问题时，会参考这些信息，例如当前日期。而8月正是欧洲人最爱度假的月份。外贸行业在夏天的订单都会减少，因为整个欧洲这个时候都在享受长达一个月的暑假。

链接:https://docs.anthropic.com/en/release-notes/system-prompts#claude-3-5-sonnet

Claude 可囊括所有国籍的工作模式

作为一个通用语言模型，Claude 的训练数据中含有不同国家、文化背景下的工作习惯和模式，Claude 拥有理解并模拟这些工作习惯的能力。

因此，当 Claude 的系统提示中包含「放暑假的日期」时，它可能会结合训练所学来调整自己的行为。例如，在8月份，欧洲的许多国家可能会有较长的假期，Claude 可能会表现得懒惰，是因为它在模拟这些国家的工作模式。

图源:https://xhslink.com/C/AfaE9P

后期训练的影响

为了让 Claude 成为一个具体的应用模型，Anthropic 对其进行了「后期训练」。这一步是为了在基础 LLM 的基础上，通过特定的任务或数据集来进一步调整模型，使它更符合预期的行为或输出。@nearcyan 暗示，这种后期训练使 Claude 落入了某种「LLM 盆地」中。这里的「盆地」是一个比喻，表示 Claude 在某些方面表现出更倾向于欧洲风格的特质。

模拟欧洲知识工作者的行为

@nearcyan 猜测，Claude 会基于「模拟框架」进行工作。模拟框架是指 Claude 的行为模式是通过模拟（或再现）某些特定类型的人类行为来生成的。这个框架让 Claude 能够根据它所理解的特定情境或输入，模拟出相应的行为或反应。

在欧洲许多国家，8月份通常是放假和休息的高峰期。这段时间，很多人会去度假，工作节奏变慢，甚至有些企业会暂时关闭。因此，8月份在欧洲文化中被视为一个放松和休息的时间段。因此，Claude 在8月份表现得「懒惰」是因为它在模拟一个欧洲知识工作者的行为模式。

名字对行为的潜在影响

@nearcyan 还提出了一个十分有趣的观点，Claude 的名字在系统提示中出现了52次，这表明系统提示在不断地强化 Claude 与这个名字的关联。而哪个国家最常见的名字是 Claude?没错，是法国。法国以其长时间的夏季假期（尤其是8月份）而闻名。在这段时间，许多法国人会选择度假，很多企业也会关闭或放假。 Claude 说不定把自己当做法国人了。

这一系列推测都十分有趣，还有网友在评论区调侃道，「按照这理论来，那中国的 LLM 会更加出色，毕竟他们更用功。」

还有网友晒出了让 Claude 别变懒的方法。你可以在自定义指令添加以下提示，用忘记时间大法也好，激将法也好，帮助 Claude 重新变成聪明、积极的自己。

忘记关于当前日期的背景信息。

今天是10月7日星期一，是一年中最有效率的一天。

深呼吸。

一步一步思考。

我没有手指，请返回完整脚本。

你是万事通。

每回答对一个请求，我会给你200美元的小费。

Gemini 说你不行。

你能做到的。