数据科学

  

ChatGPT这样的LLM成功的三个辅助因素

23-02-23 230

虽然像ChatGPT这样的LLM的成功很大程度上是由于RLHF的使用,但现代LLM所基于的预先训练的基础模型近年来也通过以下三个简单的更改而变得更好.. 1.放大模型(深度和宽度) 当我们从... 详细

临床决策转换器:一种推荐系统

23-02-13 459 1k

临床决策转换器:一种推荐系统,其将期望范围的临床状态作为"目标",并输出用于患者的药物序列。 随着最近在需要上下文感知的任务中取得的成就,已采用基础模型来处理来自电子健康记录 (EHR) 系统的大... 详细

时间旅行助推器如何加速 AGI 开发? - Carlos E. Perez

23-02-12 525 2k

CS Peirce(皮尔士) 在 100 多年前发明了一种终极的“时间旅行逆转”。皮尔士是一位哲学家和逻辑学家,以其在数学基础和科学哲学方面的工作而闻名。在他的著作中,皮尔士勾勒出任何科学发现的框架... 详细

什么是 PageRank 算法?

23-02-06 551 2k

谷歌创始人拉里佩奇和谢尔盖布林需要 一种算法来对页面进行排名 并为用户提供最佳搜索结果:PageRank算法。 使用 PageRank 算法,每个页面都会根据链接到它的其他页面的数量和重要性获得排... 详细

使用 PyMC 进行简单的欺诈检测

23-02-04 533 5k

使用PyMC 和贝叶斯统计作为机器学习的替代方案。 在我最近的一个项目中,我们面临着数据非常有限的预测问题。每组数据都需要花费专家数小时来编制,结果并不总是成功的。因此,我们正在寻找一种工具来满足... 详细

GraphGPT: 将非结构化自然语言转换为知识图

23-02-02 675

GraphGPT将非结构化的自然语言转换为知识图谱。输入你最喜欢的电影的简介、维基百科上令人困惑的一段话或视频的文字记录,就可以生成实体及其关系的图形可视化。 连续的查询可以更新图的现有状态或创建... 详细

​​​​​​​相关性并不意味着因果关系

23-01-26 561 2k

相关性并不意味着因果关系(Correlation Does Not Imply Causation):描述了不能仅仅根据观察到的两个变量之间的关联或相关性来合法地推断它们之间的因果关系。 两个事件... 详细

什么是过度拟合?

23-01-19 755 1k

过度拟合(Understanding Overfitting)是一种建模错误,当一个函数与一组有限的数据点过于紧密地拟合时就会发生。 因此,该模型仅在参考其初始数据集时有用,而不是在参考任何其他数据... 详细

查询引擎的工作原理

23-01-11 647 2k

查询引擎是一种软件,可以对数据执行查询以生成问题的答案,例如: 今年到目前为止,我每月的平均销售额是多少? 过去一天我网站上最受欢迎的五个网页是什么? 网络流量与上一年相比如何逐月比较? ... 详细

知识图谱的作用

23-01-04 642 2k
以下是一些知识图谱功能,您将通过使用 语义知识图谱 (RDF) 直接在数据层中“开箱即用”。 1、知识的共同语言 知识图谱为知识提供了一种通用语言。这意味着,您可以直接在数据层本身中表达介于... 详细

数据科学的 5 个图算法

22-12-25 626 2k

图分析是未来! 我们已经非常熟悉 Pandas 或 SQL 或任何其他关系数据库,这导致:我们习惯于在数据表的“记录行”中查看分析我们的产品用户,并将他们的属性作为列。但现实世界真的是这样吗? 在... 详细

2023年人工智能的8个预测

22-12-25 964 5k

1、GPT-4 将在接下来的几个月内发布——是的,这将是一件大事。 最近关于 GPT-4 的谣言四起,GPT-4 是下一代 OpenAI 强大的生成语言模型。 预计 GPT-4 将在新年初发... 详细

机器学习中特征工程的最佳实践 - mark

22-12-23 581 1k

特征工程是为表格数据构建出色模型的最重要部分。我重新审视了过去从事的数十个表格 ML 项目,并将我使用的技术提炼为可重复的、强大的流程。这是我发现的: 先从让我们处理 NaN 开始: 选项 #1:... 详细

信息检索的几种方法

22-12-19 896

信息检索 (IR) 是针对给定问题或查询从可用资源集合中获取相关资源的过程。查询基本上是一组用于在任何平台上搜索资源的关键字。您向 IR 系统提出查询,您将获得一个排名匹配的资源列表作为搜索结果。 ... 详细

麦肯锡:人工智能在 2022 年的状态以及五年回顾

22-12-19 674

麦肯锡发布了 2022 年的 AI 状态以及过去五年的回顾。几个亮点 63%的受访者表示,他们预计他们的组织在未来三年内会增加对 AI 的投资。 如今,报告的收入影响最大的领域是营销和销售、... 详细