数据科学
ChatGPT这样的LLM成功的三个辅助因素

虽然像ChatGPT这样的LLM的成功很大程度上是由于RLHF的使用,但现代LLM所基于的预先训练的基础模型近年来也通过以下三个简单的更改而变得更好.. 1.放大模型(深度和宽度) 当我们从... 详细
临床决策转换器:一种推荐系统

临床决策转换器:一种推荐系统,其将期望范围的临床状态作为"目标",并输出用于患者的药物序列。 随着最近在需要上下文感知的任务中取得的成就,已采用基础模型来处理来自电子健康记录 (EHR) 系统的大... 详细
时间旅行助推器如何加速 AGI 开发? - Carlos E. Perez

CS Peirce(皮尔士) 在 100 多年前发明了一种终极的“时间旅行逆转”。皮尔士是一位哲学家和逻辑学家,以其在数学基础和科学哲学方面的工作而闻名。在他的著作中,皮尔士勾勒出任何科学发现的框架... 详细
什么是 PageRank 算法?

谷歌创始人拉里佩奇和谢尔盖布林需要 一种算法来对页面进行排名 并为用户提供最佳搜索结果:PageRank算法。 使用 PageRank 算法,每个页面都会根据链接到它的其他页面的数量和重要性获得排... 详细
使用 PyMC 进行简单的欺诈检测

使用PyMC 和贝叶斯统计作为机器学习的替代方案。 在我最近的一个项目中,我们面临着数据非常有限的预测问题。每组数据都需要花费专家数小时来编制,结果并不总是成功的。因此,我们正在寻找一种工具来满足... 详细
GraphGPT: 将非结构化自然语言转换为知识图

GraphGPT将非结构化的自然语言转换为知识图谱。输入你最喜欢的电影的简介、维基百科上令人困惑的一段话或视频的文字记录,就可以生成实体及其关系的图形可视化。 连续的查询可以更新图的现有状态或创建... 详细
相关性并不意味着因果关系

相关性并不意味着因果关系(Correlation Does Not Imply Causation):描述了不能仅仅根据观察到的两个变量之间的关联或相关性来合法地推断它们之间的因果关系。 两个事件... 详细
数据科学的 5 个图算法

图分析是未来! 我们已经非常熟悉 Pandas 或 SQL 或任何其他关系数据库,这导致:我们习惯于在数据表的“记录行”中查看分析我们的产品用户,并将他们的属性作为列。但现实世界真的是这样吗? 在... 详细
2023年人工智能的8个预测

1、GPT-4 将在接下来的几个月内发布——是的,这将是一件大事。 最近关于 GPT-4 的谣言四起,GPT-4 是下一代 OpenAI 强大的生成语言模型。 预计 GPT-4 将在新年初发... 详细
机器学习中特征工程的最佳实践 - mark

特征工程是为表格数据构建出色模型的最重要部分。我重新审视了过去从事的数十个表格 ML 项目,并将我使用的技术提炼为可重复的、强大的流程。这是我发现的: 先从让我们处理 NaN 开始: 选项 #1:... 详细
麦肯锡:人工智能在 2022 年的状态以及五年回顾

麦肯锡发布了 2022 年的 AI 状态以及过去五年的回顾。几个亮点 63%的受访者表示,他们预计他们的组织在未来三年内会增加对 AI 的投资。 如今,报告的收入影响最大的领域是营销和销售、... 详细