机器学习教程

     

Scikit-learn SVM 实现

17

支持向量机 (SVM) 是用于分类、回归和异常值检测任务的最通用和最广泛使用的机器学习算法之一。在 SVM 实现领域,Scikit-learn 因其易用性和鲁棒性而成为首选库。然而,掌握 Scikit.

随机学习简介

19 2K

了解随机学习:深入研究自适应和高效的机器学习在机器学习领域,算法旨在从数据中学习并做出预测或决策,随机学习作为一种强大且多功能的方法脱颖而出。随机学习方法因其效率和适应性而备受赞誉,在解决从金融和医疗.

大模型对AI研究有害?

50

在 GPT4 之后,大模型LLM 的性能和设计改进进展相对较少:使其变得更好的主要方法仍然只是将其做大,而且所有替代transformer的架构都被证明是不合格的、低劣的,它们将人们的注意力(和投资).

Scikit-learn可扩展学习简介

19 2K

随着机器学习模型变得越来越复杂和数据集变得越来越大,可扩展性成为从业者和研究人员的一个重要关注点。虽然 Python 的 scikit-learn 库提供了广泛的机器学习算法,但其有效处理大型数据集的.

机器学习中的元学习

38 2K

元学习的分支,也称为学习学习,被定义为从不同算法中学习的学习算法。其主要目的是在其他算法的帮助下增强算法的性能。这种方法提供了解决深度学习的几个传统问题的机会,例如数据和处理瓶颈以及泛化。元学习还可以.

使用 SVM 和决策树进行集成学习

38 4K

集成学习是一种机器学习技术,它结合了多个单独的模型来提高预测性能。集成学习中使用的两种流行算法是支持向量机 (SVM) 和决策树。什么是集成学习?通过合并许多模型(也称为“基础学习器”或“弱学习器”).

量子机器学习 (QML)

20 3K

量子机器学习(QML)是一个研究领域,探索量子计算和系统认知之间的相互作用。例如,我们想知道量子计算机是否可以加快训练或比较获得版本知识的系统所需的时间。另一方面,我们能够利用系统的策略来帮助我们找到.

机器学习中的 CatBoost

48 4K

一种名为 CatBoost 的灵活有效的技术可用于快速发展的机器学习领域,在该领域,创新是标准,数据是一切进步的源泉。这种方法的名字很有趣,是“Categorical Boosting”的变体,它彻底.

什么是数据准备?

91 4K

原始数据可能包含也可能不包含错误和不一致。因此,得出可行的见解并不简单。我们必须准备数据,以将我们从不完整、不准确和非结构化数据的陷阱中拯救出来。在本文中,我们将了解数据准备、过程以及在此过程中面临的.

数据分析与机器学习

44

数据分析和机器学习是从大量信息中提取意义的重要方法。尽管它们有共同点,但这些方法也具有本质区别。什么是数据分析数据分析领域需要探索原始数据以揭示潜在的模式、联系和发展。它涵盖了广泛的技术,包括描述性、.

规则引擎与机器学习比较

75

规则引擎使用预定义的逻辑来做出决策,而机器学习算法则从数据中学习来做出预测或决策。规则引擎和机器学习代表了计算机系统中两种根本不同的决策和预测方法。虽然规则引擎根据人类设置的明确的预定义规则运行,但机.

Keras 中使用 LSTM 进行多元时间序列预测

75 12K

多元预测需要利用多个与时间相关的变量来生成预测。这种预测方法结合了历史数据,同时考虑了模型内变量之间的相互依赖性。在本文中,我们将探索使用 LSTM 进行多元预测的世界,深入了解其核心,探索其应用,并.

Tensorflow中用Abalone数据集构建序列模型

129 4K

借助人工智能和机器学习,我们现在以截然不同的方式应对各个行业的挑战性挑战。我们采用的一项重要技术是深度学习。为了揭示数据中复杂的关系和模式,它利用了专门的网络。我们可以借助著名的 Google 程序 .

Python中PyCaret简介

70 3K

 PyCaret,一个新的 Python 机器学习库。 PyCaret 被誉为数据科学家的低代码资源,旨在缩短机器学习实验的“从假设到见解的周期时间”。它使数据科学家能够快速有效地完成实验。只需几行代.

学习机器学习与应用机器学习的区别

53

开发新的机器学习技术所需的技能与有效应用机器学习所需的技能几乎没有重叠。有点像芯片设计与软件工程几乎没有重叠。这就是建模者与机器学习工程师之间的区别商业应用通常与研究和理论有很大不同。对于机器学习来说.

MLOps:您需要了解的一切

47 5K

近年来,对数据相关职位的需求不断增长。从不同技术背景转向数据行业的人数比例不断增长。数据科学和分析工作是大多数人梦想的竞争激烈的工作角色。然而,数据行业的其他领域却鲜为人知。这就是机器学习操作 (ML.

人工智能领域的 GoogleNet

49 4K

在人工智能 (AI) 和机器学习 (ML) 领域,有一个不变的真理:创新推动进步。多年来,研究人员和工程师不断突破人工智能所能实现的界限,每一次突破都为新的、令人兴奋的可能性铺平了道路。其中一个突破性.

机器学习工程师必须具备的 10 项技能

88 2K

在本文中,我们将探讨机器学习工程师必备的 10 项技能。什么是机器学习在机器学习中,计算机从数据中学习并根据该数据做出预测。就像我们用例子教孩子一样,就像我们用例子教计算机算法一样。在这个领域,我们检.

机器学习中的简单线性回归

54 6K

y=XB+E 是什么公式?这是一个线性回归模型的表示式,其中: y 是目标变量(或响应变量), X 是特征矩阵,包含观察样本的特征值, B 是系数矩阵,包含每个特征对应的系数, E 是误差项,表示模型.

递归神经网络和循环神经网络比较

86

"递归神经网络"(Recursive Neural Network)和"循环神经网络"(Recurrent Neural Network, RNN)是两个概念在不同领域中的使用,它们有一些相似之处,但.

基础认知框架:强化学习+代理

64 4K

本文介绍了TAME(Technological Approach to Mind Everywhere)框架和强化学习(RL)的概念,旨在将生物学和人工智能领域进行交叉研究。这种将生物学和强化学习相结.

使用一个深度学习 pCTR 模型分析广告效果

68 3K

在 Instacart Ads,我们的重点在于向客户提供最具相关性的广告,促进新颖的产品发现并增强他们的杂货购物之旅。同时,我们努力通过提高品牌认知度、增加产品销量和扩大客户范围来为广告商提供价值。在.

分层随机抽样——概述

186 3K

分层随机抽样是一种用于机器学习和数据科学, 从大量群体中选择随机样本用于训练和测试数据集。当总体不够大时,随机抽样可能会引入偏差和抽样误差。分层随机抽样可确保样本充分代表整个总体。分层随机抽样通过将总.

经典频率统计和贝叶斯统计之间关系

79

经典频率统计和贝叶斯统计之间存在微妙关系,特别是在 p 值和贝叶斯后验的背景下。关键点:古典频率论者:P 值: 在经典频率统计中,p 值通常用于评估反对原假设的证据。 p 值是对原假设证据强度的衡量。.

Python中C5.0决策树算法

134 2K

C5.0 算法是罗斯-昆兰(Ross Quinlan)开发的专利算法。不过,在 R 编程语言中也有名为 C5.0 的开源实现。在 Python 中,您可以使用 c50 软件包,它是 C5.0 算法的 .

MLX:苹果发布新的机器学习框架

276 1

苹果刚刚进入AI开源竞技场,悄悄发布了他们的新DL框架MLX!它在Apple Silicon上原生运行代码,只需一个pip安装,没有其他依赖项MLX 是 Apple 芯片上用于机器学习的阵列框架,由 .

Marker:快速、高精度地将 PDF 转换为 Markdown的免费工具

626 4K
Marker 将 PDF、EPUB 和 MOBI 转换为 Markdown。它比 nougat 快 10 倍,比 arXiv 更准确,而且幻觉风险很低。 Marker 针对吞吐量进行了优化,比如转换 .

OpenAI突破:Q*超级智能

274 1 3K

OpenAI的突破涉及一种称为Q*(Q-star 可能是Q-learning)的东西,消息表明它与奥特曼被解雇有关的。Q-learning是一类强化学习,并不是新的,但是最近在将Q-learning与.

最近金融量化交易的研究成果列表

84 17K

基于 Shapley 的投资组合绩效方法:SPPC 方法可以确定单个预测变量对投资组合绩效的贡献,揭示回报可预测性的经济价值来源。(2023-11-09,股数:3.0)使用神经网络进行波动率建模:引入.

如何保持生物和AI的表征一致性?

82

在生物和AI之间获得表征”一致性对齐“概念是认知科学、神经科学和机器学习的关键。问题是:这些知识在不同科学社区之间的转移往往有限。这篇论文是来弥合这一差距的!目标为跨学科的表征对齐研究提供理论基础。我.