Octoverse:2023年Github开源状况和人工智能的崛起


在今年的 Octoverse 报告中,研究了Github上围绕 AI、云和 Git 的开源活动如何改变开发人员体验。

三大趋势:

  • 开发人员正在大量使用生成式人工智能进行构建。
  • 开发人员正在大规模运营云原生应用程序。
  • 2023 年首次开源贡献者数量最多。 GitHub 上的私人项目显着增长,同比增长 38%,占 GitHub 上所有活动的 80% 以上。

美国拥有 2020 万开发者,过去一年开发者增长 21%,继续拥有全球最大的开发者社区。但自 2013 年以来,我们不断看到其他社区在整个平台上实现了更多增长,

1、亚太地区、非洲、南美洲和欧洲的开发者社区逐年扩大,其中印度、巴西和日本处于领先地位。

预计到 2027 年印度将取代美国成为 GitHub 上最大的开发者社区。

  • 印度的开发者社区继续实现同比大幅增长:

在去年的 Octoverse 中,我们预测印度的开发者总数将超过美国。这仍然有望发生。印度的开发者人数同比增长 36%,2023 年有 350 万新开发者加入 GitHub。

作为联合国支持的数字公共产品联盟的一部分,印度一直在利用开放材料(从软件代码到人工智能模型)建设数字公共基础设施,以改善数字支付和电子商务系统。以下是印度开发人员在 GitHub 上构建并贡献的开源软件 (OSS) 项目列表。

  • 新加坡今年是亚太地区开发者人数增长最快的国家,

以开发者占总人口的比例最高而位居全球第一。新加坡国立大学计算机学院将 GitHub 纳入其课程,高增长也可能归因于该国在东南亚的监管重要性。

2、非洲地区拥有世界上增长最快的人口和不断增加的开发人员(例如,在肯尼亚,小学和中学必须教授编程。)
尼日利亚是 OSS 采用和技术投资的热点,其 45% 的同比增长率(全球增幅最高)反映了这一点。GitHub 上还有至少 200 个由尼日利亚开发者制作的项目集合,可以在“[url=https://github.com/collections/made-in-africa]非洲制造[/url]”集合下找到。

3、南美洲的开发者增长率与亚太和非洲一些增长最快的开发者社区相当。2023年,巴西的开发者人数是该地区最多的,并继续以两位数增长,同比增长30%。此前,巴西的私人和公共组织持续投资。查看巴西开发人员在 GitHub 上创建和贡献的OSS 项目列表。
我们还看到阿根廷和哥伦比亚的持续增长,这两个国家在过去几年中已成为组织的热门投资目标。

4、欧洲发展最快的开发者社区
整个欧洲的社区开发人员总数继续增加,但他们的发展现在更接近于美国的总体发展,因为南美洲、非洲和亚太地区的社区增长超过了他们。

2023 年生成式 AI 爆发式增长
2023 年的 GitHub 数据反映了这些人工智能项目如何从更面向专业的工作和研究发展到更主流的采用,开发人员越来越多地使用预先训练的模型和 API 来构建由人工智能驱动的生成应用程序。

开发人员越来越多地尝试人工智能模型。在过去的几年里,我们看到开发人员使用tensorflow/tensorflowpytorch/pytorch等机器学习库构建项目,而现在我们看到更多的开发人员尝试使用AI模型和LLM(例如ChatGPT API)。

开源人工智能创新多种多样,顶级人工智能项目由个人开发者拥有。分析 GitHub 上排名前 20 的开源生成式 AI 项目,其中一些顶级项目归个人所有。这表明 GitHub 上的开源项目继续推动创新,并向我们所有人展示行业的未来发展,社区围绕最令人兴奋的进步而构建。

生成式人工智能正在推动生成式人工智能项目的个人贡献者在全球范围内大幅增长,同比增长 148%,生成式人工智能项目总数也同比增长 248%。值得注意的是,美国、印度和日本在开发者社区中处于领先地位,其他地区(包括香港特别行政区)、英国和巴西紧随其后。

最流行的编程语言
JavaScript 再次夺得第一大最受欢迎语言的桂冠,并且我们继续看到 Python 和 Java 等熟悉的语言逐年保持在前五名语言之列。

今年,TypeScript 首次超过 Java,成为 GitHub 上 OSS 项目中第三大最受欢迎的语言,其用户群增长了 37%。

用于数据分析和操作的流行语言和框架显着增加。T-SQL 和 TeX 等古老语言在 2023 年不断发展,这凸显了数据科学家、数学家和分析师如何越来越多地使用开源平台和工具。

Rust、Lua和 Go HCL、Python在 GitHub 上的新项目中出现了更大的增长。

Rust 和 Lua 都以其内存安全性和效率而闻名,并且都可以用于系统和嵌入式系统编程,这可以归因于它们的增长。Go 最近的增长是由 Kubernetes 和 Prometheus 等云原生项目推动的。

2023 年,Shell 和 Hashicorp 配置语言 (HCL) 再次成为开源项目中的顶级语言,这表明运维和 IaC 工作在开源领域越来越受到重视。

  • HCL 采用率同比增长 36%,这表明开发人员正在为其应用程序利用基础设施。
  • HCL 的增加表明开发人员越来越多地使用声明性语言来指示他们如何利用云部署。

开源状态
2023 年,开发者为 GitHub 上的开源项目做出了总计 3.01 亿的贡献,其中包括Mastodon等热门项目到Stable DiffusionLangChain等生成式 AI 项目。

商业支持的项目继续吸引一些最开源的贡献,但 2023 年是生成式 AI 项目也进入 GitHub 上十大最受欢迎项目的第一年。说到生成式 AI,几乎三分之一拥有至少一颗星的开源项目都有一位使用 GitHub Copilot 的维护者。

商业支持的项目继续领先。2023 年,贡献者总数最大的项目获得了压倒性的商业支持。这是去年以来的持续趋势,microsoft/vscodeflutter/fluttervercel/next.js在 2023 年再次跻身前 10 名。

生成式人工智能在开源和公共项目中快速发展。2023 年,我们看到基于 AI 的生成式 OSS 项目,如langchain-ai/langchainAUTOMATIC1111/stable-diffusion-webui,在 GitHub 上按贡献者数量跃居榜首。

开源维护者正在采用生成式人工智能。几乎三分之一拥有至少一颗星的开源项目都有使用 GitHub Copilot 的维护者。这是我们向开源维护人员免费提供 GitHub Copilot 的计划,并表明生成式 AI 在开源领域的采用日益广泛。

开发人员看到了组合包和容器化的好处。正如我们之前指出的,2023 年有 430 万个存储库使用了 Docker。另一方面,Linux 发行版NixOS/nixpkgs在过去两年中一直位居贡献者开源项目的榜首。