数据科学

     

数据科学的三个基础常识

70

每个数据科学家都需要了解这些观点,它们会让你大开眼界。 1.相关性与因果关系 P(.

什么是GARCH模型及其陷阱?

49

广义自回归条件异方差 (GARCH) 是一种用于分析时间序列数据的统计模型,其中方差误差被认为是连续自相关的。GARCH 模型假设误差项的方差遵循自回归移动平均过程.

研究首次表明乌鸦能使用统计逻辑

85

arstechnica报道,一项新的研究表明,乌鸦能够基于统计推断进行复杂的推理:鸟类可以将图像与不同的奖励概率联系起来。 .

哈特奖:压缩算法竞赛奖

78

Hutter 奖是一项奖励智能压缩器/数据压缩程序开发的竞赛,目前总奖金为 23,034 欧元。目标是将 1GB 文件 enwik9 压缩到小于当前记录的约.

股票预测神经网络和机器学习示例

95

本项目是使用样本股票数据的 Python 神经网络和 ML 股票预测方法示例。 ML 和 NN 方法和库的资料库,.

腾讯使用大语言模型增强基于Doris的OLAP服务

157 1

腾讯利用大型语言模型 (LLM) 增强基于 Apache Doris 的 OLAP 服务 腾讯采用大型语言模型 (.

用Python实现KNN量化交易步骤

128 8K
K 最近邻 (KNN)、支持向量机 (SVM)、随机森林和神经网络等ML 技术常用于交易应用程序。这些算法可以分析历史价格数据、市场指标、新闻情绪和其他相关.

用 C++ 编写的自托管加密货币交易机器人(自动高频做市)

140

K是一系列(高度可定制的)极低延迟的做市交易机器人,具有功能齐全的网络界面。 在一台像样的机器上,它可以在几个兼容的交易所之一下单和取消订单,每个订单.

量化金融面试实用指南

164 2K

如何在量化金融(主要侧重于交易)领域找到实习或应届毕业生职位。 简历 确保优化简历.

阿兰·图灵:数学符号表达的问题并不都能用算法解决

127 3K
算法已经变得无处不在。它们优化我们的通勤、处理支付并协调互联网流量。 只要可以用精确的数学术语表达的问题(问题空间.

10个来之不易的AI产品教训

187

我是一家生成式人工智能咨询公司的创始人,我们为其他公司开发基于人工智能的产品。我们已经这样做了18个月了,我想我分享我们的经验-这可能会帮助其他人。 .

OpenAI推出ChatGPT企业版

205

ChatGPT企业版现已推出,其功能如下: - 无限制访问GPT-4(无使用上限) - 针对GPT-4的更高速度性能(最多快.

分子生物学中的大语言模型

388 8K

分子生物学的中心法则描绘了从基因组到基因表达和随后的蛋白质生产的分子信息流,蛋白质是生命的基本组成部分。 基因组中.

OpenAI向ChatGPT Plus用户推出Code Interpreter

382

这是OpenAI自GPT-4以来发布的最强大的功能。 让每个人都成为数据分析师 以下是Code Interpreter的1.

什么是AI矢量数据库?

557 7K

对于涉及大型语言模型、生成式人工智能和语义搜索的应用程序来说,高效的数据处理变得比以往任何时候都更加重要。 所有这些新应用.

用知识图谱提取专业文献关键词

284

简洁地可视化和总结或“压缩”大约 10,000 个单词的百科全书式哲学文章,仅包含一组 24 个最常用的非通用单词。 .

MotherDuck:大数据已死

537 5K

十多年来,人们很难从他们的数据中获得可操作的洞察力,这一事实被归咎于其规模。诊断结果是 "你的数据对你那微不足道的系统来说太大了",而治疗方法是购买一些能够.

pandas 2.0 新变化

582

Pandas 2.0来了!这是自Pandas诞生以来最大的一次大修,而且已经酝酿了多年。 然而,你可能不会注意到太.

揭密Tweepcred:Twitter推荐引擎背后的力量

487 6K

您已经在 Twitter 上看到一些人具有某种影响力,他们的推文以近乎神奇的效率获得点赞、转发和回复。但是你有没有想过这种影响力是什么? .

BloombergGPT:金融领域的大语言模型

773

NLP 在金融技术领域的应用广泛而复杂,应用范围从情感分析和命名实体识别到问答。 大语言模型 (LLM) 已被证明.

ChatGPT这样的LLM成功的三个辅助因素

580

虽然像ChatGPT这样的LLM的成功很大程度上是由于RLHF的使用,但现代LLM所基于的预先训练的基础模型近年来也通过以下三个简单的更改而变得更好.. .

临床决策转换器:一种推荐系统

675

临床决策转换器:一种推荐系统,其将期望范围的临床状态作为"目标",并输出用于患者的药物序列。 随着最近在需要 .

时间旅行助推器如何加速 AGI 开发? - Carlos E. Perez

716 2K

CS Peirce(皮尔士) 在 100 多年前发明了一种终极的“时间旅行逆转”。皮尔士是一位哲学家和逻辑学家,以其在数学基础和科学哲学方面的工作而闻名。在.

什么是 PageRank 算法?

837 2K

谷歌创始人拉里佩奇和谢尔盖布林需要 .

使用 PyMC 进行简单的欺诈检测

1328 5K

使用PyMC 和贝叶斯统计作为机器学习的替代方案。 在我最近的一个项目中,我们面临着数据非常有限的预测问题。每组数.

GraphGPT: 将非结构化自然语言转换为知识图

1280

GraphGPT将非结构化的自然语言转换为知识图谱。输入你最喜欢的电影的简介、维基百科上令人困惑的一段话或视频的文字记录,就可以生成实体及其关系的图形可视化.

​​​​​​​相关性并不意味着因果关系

1154 2K

相关性并不意味着因果关系(Correlation Does Not Imply Causation):描述了不能仅仅根据观察到的两个变量之间的关联或相关性来.

什么是过度拟合?

1565

过度拟合(Understanding Overfitting)是一种建模错误,当一个函数与一组有限的数据点过于紧密地拟合时就会发生。 因此,该模型仅在.

查询引擎的工作原理

941 2K

查询引擎是一种软件,可以对数据执行查询以生成问题的答案,例如: 今年到目前为止,我每月的平均销售额是多少? 过去一天我网站上.

知识图谱的作用

1319 1 2K
以下是一些知识图谱功能,您将通过使用 .