• 随着基础模型的兴起,VectorDatabase(矢量数据库/向量数据库)的受欢迎程度直线上升。事实上,向量数据库在大型语言模型的上下文之外也很有用。 当涉及到机器学习时,我们经常与向量嵌入打交道。向量数据库的创建是为了在处理它们时有特别好的表现:
  • 在Netflix,我们有数百个微型服务,每个都有自己的数据模型或实体。例如,我们有一个存储电影实体元数据的服务或一个存储图像元数据的服务。所有这些服务在以后都想对他们的对象或实体进行注释。我们的团队,资产管理平台,决定创建一个名为Marken的通用服务
  • 时间序列预测是机器学习历史最悠久的应用之一,也是整个行业使用最普遍的技术之一(如果不是最普遍的话)。然而,在最近的 ML 热潮中,预测有些落伍了。 时间序列预测正在成为一门失传的艺术。 它是美国零售业50亿美元背后的引擎。 然而,研究进展缓慢,交易 icon
  • 在今年著名的自然语言处理(NLP)ACL 会议上发表的一篇新论文在研究人员中引起了热议。该论文表明,使用 gzip 和 K-nearest neighbour (KNN) 组合对文本进行分类的性能与包括 BERT 在内的最先进模型不相上下。 在大量 icon
  • 这篇综述重点介绍了过去三十年来在驱动归纳推理的过程的计算建模方面取得的进展。 这些模型的形式复杂性和解释范围都取得了重要进展。 需要注意的是,这项工作的大部分重点是证明给定模型可以很好地说明归纳数据,而不 icon
  • 在过去十年中,机器学习软件开发的格局经历了重大变化。许多框架层出不穷,但大多数框架都严重依赖利用Nvidia的CUDA,并在Nvidia GPU上表现最佳。 然而,随着PyTorch 2.0和OpenAI的Triton的到来,Nvidia在该领域的 icon
  • 形状只是数字间几何图形 icon
  • 这是上周顶级 ML 论文(3 月 27 日至 4 月 2 日): BloombergGPT 一个新的 50B 参数的金融 LLM。声称拥有 3630 亿个令牌的最大特定领域数据集......进一步增加了来自 icon
  • 有选择地从科技公司的工程博客中挑选了博客文章: [Meta] icon
  • K 最近邻 (KNN)、支持向量机 (SVM)、随机森林和神经网络等ML 技术常用于交易应用程序。这些算法可以分析历史价格数据、市场指标、新闻情绪和其他相关因素,以预测未来价格走势并确定最佳进入和退出点。 K 最近邻 (KNN) 是机器学习中用于回 icon
  • 梯度下降算法可以通过包含意想不到的大步长来更快地工作,而研究人员长期以来认为呈梯度逐步完善的,所以取名梯度下降。 寻找最佳解决方案场景到处都是: 手机的 GPS 会计算到达目的地的最短路线。 旅游网站会搜索与您的行程相匹配的 icon
  • 人类是探索的大师。 与机器强化学习RL不同的是:我们不是像RL那样通过尝试最大化奖励来探索,而是通过探索来获取信息! 这是标准RL机器学习速度比人类慢得多的主要原因。 icon
  • 相似性搜索,包括确定两个或多个时间序列之间存在的相似程度,是某种交易系统中的基本任务。典型应用包括检测: - 图案 - 趋势 - 异常 - 集群 下面是一些常用的技巧: - 欧氏距离 icon
  • 本项目是使用样本股票数据的 Python 神经网络和 ML 股票预测方法示例。 ML 和 NN 方法和库的资料库,以及用于训练和测试的样本股数据。这些示例简单易懂,突出了每种方法的基本组成部分。示例还展示了如何在当前数据上运行模型,以获得股票预测结 icon
  • 从最近的科技公司工程博客中精选博文: [Meta]  icon
  • 美国国防高级研究计划局 (DARPA) 正在资助一个名为“用于规划、战术、实验和弹性的战略混沌引擎”( icon
  • 虽然传统深度神经网络等机器学习技术在感知任务上取得了显著的成功,但在逻辑和推理问题上的表现仍然有限。这成为开发透明、可信的人工智能的一大障碍。 本文介绍的新 Boolformer 模型为符号逻辑任务提供了一个开创性的解决方案。它代表了第一种机器学习方法,可 icon
  • Netflix 是迈向实时数据基础设施的公司的典范 ,这使得 Netflix 能够通过多种方式改善用户体验,例如改进“Trending Now”主屏幕上的推荐、快速测试生产中的更改以及最大限度地减少 Netflix 服务的停机时间。 数据处理领域的 icon