斯坦福大学2024人工智能状况报告


斯坦福大学新的人工智能指数报告 [PDF]的主要要点:
1.人工智能在某些任务上胜过人类,但并非在所有任务上。人工智能已在多项基准测试中超越人类,包括在图像分类、视觉推理和英语理解方面。然而,它在竞赛级数学、视觉常识推理和规划等更复杂的任务上却落后于人类。

2.行业继续主导人工智能前沿研究。2023 年,产业界产生了 51 个著名的机器学习模型,而学术界仅贡献了 15 个。2023 年,产学合作还产生了 21 个著名模型,创下新高。

3.前沿模型变得更加昂贵。根据 AI Index 的估计,最先进的人工智能模型的训练成本已经达到了前所未有的水平。例如,OpenAI的GPT-4估计使用了价值7800万美元的计算来进行训练,而谷歌的Gemini Ultra则花费了1.91亿美元的计算费用。

4.美国领先于中国、欧盟和英国,成为顶级人工智能模型的主要来源。2023年,61个著名的人工智能模型源自美国的机构,远远超过欧盟的21个和中国的15个。

5.严重缺乏对 LLM 责任的可靠和标准化评估。人工智能指数的最新研究显示,负责任的人工智能报告严重缺乏标准化。包括 OpenAI、谷歌和 Anthropic 在内的领先开发者主要根据不同的负责任人工智能基准测试其模型。这种做法使系统比较顶级人工智能模型的风险和局限性的工作变得更加复杂。

6.生成式人工智能投资激增。尽管去年整体人工智能私人投资有所下降,但用于生成式人工智能的资金激增,比2022年增长了近八倍,达到252亿美元。生成式人工智能领域的主要参与者,包括 OpenAI、Anthropic、Hugging Face 和 Inflection,都报告了大量的融资轮次。

7.数据显示:人工智能让工人更有生产力,并带来更高质量的工作。2023年,多项研究评估了人工智能对劳动力的影响,表明人工智能能让工人更快地完成任务,并提高产出质量。这些研究还表明,人工智能有可能缩小低技能和高技能工人之间的技能差距。不过,其他一些研究告诫人们,在没有适当监督的情况下使用人工智能可能会导致绩效下降。

8.得益于人工智能,科学进步进一步加速。2022 年,人工智能开始推动科学发现。然而,2023 年,与科学相关的更重要的人工智能应用启动了--从使算法排序更高效的 AlphaDev,到促进材料发现过程的 GNoME。

9.美国的人工智能法规数量急剧增加。美国人工智能相关法规的数量在过去一年和过去五年中大幅上升。2023年,人工智能相关法规有25项,而2016年仅有1项。仅去年一年,人工智能相关法规总数就增长了56.3%。

10.全球各地的人们对人工智能的潜在影响有了更深刻的认识--也更加紧张。益普索(Ipsos)的一项调查显示,在过去一年中,认为人工智能将在未来三到五年内对其生活产生巨大影响的人的比例从60%上升到66%。此外,52%的人对人工智能产品和服务表示紧张,比2022年上升了13个百分点。在美国,皮尤的数据显示,52%的美国人表示对人工智能的担忧多于兴奋,这一比例比2022年的37%有所上升。