ChatGPT通过了最具挑战性的美国三大专业考试

banq


ChatGPT 显然通过了一些最具挑战性的美国专业考试:

  • 美国医学执照考试
  • MBA考试
  • 律师资格考试

1、美国医学执照考试
在这篇ChatGPT 在 USMLE 上的表现:使用大型语言模型进行 AI 辅助医学教育的潜力文章中,我们评估了名为 ChatGPT 的大型语言模型在美国医学执照考试 (USMLE) 中的表现,该考试由三项考试组成:第 1 步、第 2CK 步和第 3 步。ChatGPT 在所有这三项考试中均达到或接近通过门槛没有任何专门的训练或强化。此外,ChatGPT 在其解释中表现出高度的一致性和洞察力。这些结果表明,大型语言模型可能有助于医学教育,并可能有助于临床决策。

2、律师资格考试
这篇GPT 参加律师资格考试论文声称:在这项研究中,我们记录了我们对 OpenAI 的 text-davinci-003 模型性能的实验评估,通常称为 GPT-3.5,在考试的多状态多项选择 (MBE) 部分。虽然我们发现在我们的训练数据规模上微调 GPT-3.5 的零样本性能没有任何好处,但我们确实发现超参数优化和提示工程对 GPT-3.5 的零样本性能产生了积极影响。为了获得最佳提示和参数,GPT-3.5 在完整的 NCBE MBE 练习考试中实现了 50.3% 的标题正确率,大大超过了 25% 的基线猜测率,并且在证据和侵权方面的通过率都很高。GPT-3.5 的响应排名也与正确性高度相关;它的前两个和前三个选择分别在 71% 和 88% 的时间里是正确的,表明非常强大的非蕴含性能。

3、MBA考试
这篇聊天GPT3会得到沃顿商学院的MBA吗?论文:
OpenAI的Chat GPT3已经显示出显著的能力,可以将一些高报酬的知识工作者的技能自动化。

  • 绩效指标,特别是由MBA毕业生担任的工作中的知识工作者。
  • 包括分析员、经理和顾问。聊城GPT3已经展示了执行以下任务的能力
  • 专业任务的能力,如编写软件代码和准备法律文件。本文的目的是要
  • 记录Chat GPT3在一个典型的MBA核心课程的期末考试中的表现,即运营管理。考试问题是按照期末考试设置上传的,然后进行评分。的 "学术表现

聊天GPT3的 "学术表现 "可以总结如下:
首先,它在基本的运营管理和流程分析问题上做得很好。
管理和流程分析问题,包括那些基于案例研究的问题。不仅答案是正确的
答案正确,而且解释也很好。

第二,Chat GPT3有时会在相对简单的计算中出现令人惊讶的错误。
在六年级数学水平的相对简单的计算中出现惊人的错误。这些错误在程度上可能是巨大的。

第三、目前版本的Chat GPT无法处理更高级的过程分析问题,即使它们是基于相当标准的模板。
当它们是基于相当标准的模板。这包括有多种产品的流程和有随机效应的问题,如需求变化性。最后,ChatGPT3在以下方面有显著的优势
修改其答案以回应人类的提示。换句话说,在它最初未能将问题与正确的解决方法相匹配的情况下,Chat GPT3能够在收到人类专家的适当提示后进行自我修正。
在收到人类专家的适当提示后,Chat GPT3能够自我纠正。考虑到这一表现,Chat GPT3将在考试中获得B至B-级的考试成绩。这对商学院的教育有重要意义,包括需要考试政策、注重人类和人工智能之间合作的课程设计、模拟真实世界决策过程的机会、真实世界的决策过程,教授创造性解决问题的需要,提高教学效率等等。

4、PCMag:ChatGPT 以 18.3 万美元的薪水通过了 3 级工程师的 Google 编码面试 :
根据一份内部文件,谷歌向ChatGPT提供编码面试问题,并根据 AI 的回答确定将聘用它担任三级工程职位。该实验是谷歌最近对多个 AI 聊天机器人进行测试的一部分,谷歌正在考虑将其添加到该网站。ChatGPT 能够为问题提供简洁、高保真的答案,可以节省用户通常花在浏览 Google 链接以查找相同信息上的时间。令人惊讶的是,ChatGPT 在面试编码职位时被 L3 录用,虽然第三级被认为是谷歌工程团队的入门级职位,但该职位的平均总薪酬约为183,000 美元。