BigCode:使用AI自动生成代码的开源工具

22-09-30 banq

像DeepMind的AlphaCode、亚马逊的CodeWhisperer和OpenAI的Codex这样的代码生成系统,为GitHub的Copilot服务提供了一个强大支撑,让人看到今天在计算机编程领域内人工智能辅助编程的可能性。

但是到目前为止,只有少数这样的人工智能系统向公众免费开放,并且是开源的--反映了建立这些系统的公司的商业动机。

为了改变这种状况,人工智能初创公司Hugging Face和ServiceNow的研发部门ServiceNow Research推出了BigCode,这是一个新项目,旨在以 "开放和负责任 "的方式为代码开发 "最先进 "的人工智能系统。
目标是最终发布一个足够大的数据集来训练代码生成系统,然后将其用于创建原型——一个 150 亿参数的模型,大小比 Codex(120 亿参数)大,但比 AlphaCode 小(约 414 亿参数)——使用 ServiceNow 的内部显卡集群。
在机器学习中,参数是 AI 系统从历史训练数据中学习的部分,本质上定义了系统在某个问题上的技能,例如生成代码。

受 Hugging Face 的BigScience开源高度复杂的文本生成系统的启发,BigCode 将向任何具有专业 AI 研究背景并能够投入时间参与该项目的人开放。申请表于今天下午上线。

假设有一天道德、技术和法律问题得到解决,人工智能驱动的编码工具可以大幅降低开发成本,同时允许编码人员专注于更具创造性的任务。根据剑桥大学的一项研究,开发人员至少有一半的精力用于调试而不是积极编程,这使软件行业每年损失约 3120 亿美元。