哈佛研究:企业员工从GPT-4中获得40%的绩效提升

哈佛大学主导的一项研究发现:与未使用人工智能的人相比,使用生成式人工智能帮助波士顿咨询集团 (BCG) 的数百名顾问更频繁、更快、更高质量地完成了一系列任务。

此外,研究表明,使用生成式人工智能时,小组中表现最差的人获得的收益最大。

这项研究由来自哈佛大学、沃顿商学院和麻省理工学院的数据科学家和研究人员进行,是自 2022 年 11 月 ChatGPT 公开发布取得爆炸性成功以来,首次对生成式人工智能在企业中的实际使用情况进行的重要研究。这项研究对企业如何部署该模型具有重要意义。

该报告是最新的研究成果,证实了生成式人工智能将对劳动力生产率产生深远影响:来自顶级精英 MBA 院校的高薪、高技能顾问的工作表现平均提升 40%,而这些任务与他们的日常工作息息相关。

这项研究还指出了公司中一些技术能力较强的顾问使用人工智能的两种新模式--研究人员称之为 "Cyborg半机器人 "和 "Centaur半人马 "行为,研究人员认为,这两种模式可能为如何处理人工智能能力不确定的任务指明了方向。

"Centaur半人马 "的行为值得注意,因为 "半人马 "已经学会把一些任务交给人工智能,例如采访摘要和其他创造性任务,而把自己的注意力放在与人类能力更相关的事情上--例如与数据或变革管理相关的任务。在某些情况下,将人类和人工智能的能力混合在一起,成为 "Cyborg半机器人 "可能会更好。

同样,研究发现,一些意想不到的任务(如创意生成)对人工智能来说很容易,而其他一些机器似乎很容易完成的任务(如基础数学)对语言学家来说却是挑战。

问题在于,人类可能会高估人工智能的能力领域。这篇论文证实了哈佛大学的戴尔-阿夸(Dell'Acqua)早前所做的其他研究,这些研究表明,对人工智能能力的信任会导致人类对其产生危险的过度依赖,并导致更糟糕的结果:用户基本上 "关闭大脑",将自己的判断外包给人工智能。

这种情况类似 "在方向盘上睡着了",他发现使用人工智能寻找求职者的招聘人员变得懒惰,结果比不使用人工智能更糟糕。

最新研究还发现,人工智能会产生同质化现象。这项研究考察了受试者为鞋业公司提出的新市场想法的差异性,结果发现,虽然这些想法的质量较高,但与未使用人工智能的顾问提出的想法相比,其差异性较小。这表明,虽然 GPT-4 有助于产生优质内容,但它可能会导致产出更加单一化。