GitHub被指控通过细微改变Copilot输出以避免版权侵权
据称,GitHub对其Copilot编程助手进行了调整,生成的代码有着细微变化,以防止输出内容被标记为授权软件的直接副本。
这一断言出现在周四对微软、GitHub和OpenAI的修正投诉中,原因是Copilot对复制开发者公开发布的开源许可代码的偏好是有据可循的。
该诉讼最初于去年11月代表四名身份不明的(“J. Doe”)原告提起,声称Copilot——一种基于OpenAI的Codex模型构建并由微软的GitHub商业化的代码建议工具——以违反版权法和软件许可要求的方式对公开发布的代码进行了训练,并将其他人的代码当作自己的代码提供。
微软、GitHub和OpenAI试图驳回此案,但只能摆脱一些指控。法官原封不动地保留了主要的版权和许可问题,并允许原告重新提交其他几项索赔,并提供更多细节。
修改后,从原来十二项指控变成八项,包括保留了违反相关数字搬去哪发,违约(违反开源许可)、不正当获利和不公平竞争索赔的指控。
修改后的起诉书增加了一名“J. Doe”原告,据称其代码Copilot已被复制。它包括原告编写的示例代码,Copilot据称已逐字复制。
上周四的法律文件称,2022年7月,为了回应公众对Copilot的批评,GitHub推出了一款名为“建议匹配公共代码”的用户可调Copilot过滤器,以避免看到重复他人工作的软件建议。
GitHub的文档解释道:“当过滤器启用时,GitHub Copilot会根据GitHub上的公共代码检查代码建议及其周围约150个字符的代码。如果有匹配或近似匹配,将不会向您显示建议。”
然而,投诉认为过滤器本质上是没有价值的,因为它只检查精确匹配,而不检测被轻微修改的输出。事实上,原告认为GitHub试图通过改变Copilot的输出来逃脱侵犯版权和许可的行为,这样它就不会被完全复制。这些小的外观变化意味着GitHub可以向Copilot客户提供无限制的许可材料的修改副本,而无需触发Copilot的逐字代码过滤器。
对此,GitHub在一封电子邮件中坚持不这样做。该公司表示,我们坚信人工智能将改变世界构建软件的方式,从而提高生产力,最重要的是,让开发人员更快乐。我们相信Copilot遵守适用的法律,我们从一开始就致力于与Copilot一起负责任地进行创新。我们将继续投资并倡导未来的人工智能开发人员体验。
- 0000
- 0000
- 0000
- 0000
- 0000