Github Copilot机器人写的代码引发纠纷


GitHub 支持人员在一封电子邮件中直接确认,是的,他们使用了所有公共 GitHub 代码,用于 Codex/Copilot,无论许可证如何。
这下引发了轩然大波:
这是一个很大的问题,是否允许您使用受版权保护/受保护的材料来训练 ML 模型?
  
令人恼火的是,它们完全具有按许可证类型进行区分的能力。github 已经可以检测代码库正在使用什么许可证,并将其显示在 UI 中。
 
一家大公司发现他们使用了托管在github私有存储库上的封闭源代码、专有许可,要多久才能提起诉讼?
 
是否可借鉴十年前的谷歌法庭裁决:十年后谷歌图书是合法。
 
您没有阅读 GitHub 服务条款吗?“您授予我们和我们的合法继承人存储、存档、解析和显示您的内容的权利,并根据提供服务的需要制作附带副本,包括随着时间的推移改进服务。”
 
GitHub 的服务条款中是否有任何部分授予他们将您的代码用于此类用途的许可?
 
我只认为 github copilot 是一个过度炒作的自动完成程序。
 
最好的选择是开始用垃圾和错误代码填充 GitHub,这样 Codex/Copilot 将写不出高质量代码。
 
不受欢迎的观点:这是不使用 github 的另一个原因。
 
问题不在于培训,而在于逐字逐句地吐出其他人的代码,以便在不同许可证下的项目中重新使用。
 
我知道微软会从她收购 github 的那天起毁了它