Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
机器学习教程
幽默:终身学习的长期主义
做一个终身学习的长期主义者。进入机器学习时代,人类其实也是一部终身学习的长期运行的“机器”。从机器学习到人机学习,机器学习是从复杂系统的大量数据中学习并以此作为决策依据,机器学习是基于数据相关性,而人类还有因果逻辑这个更强大的武器,当然,成也萧何败也萧何,归因归错误原因,变成执迷不悟,所以需
蝴蝶效应解密:破解复杂系统获2021年诺贝尔物理奖
2021 年诺贝尔物理学奖联合授予真锅秀郎、克劳斯·哈塞尔曼和乔治·帕里西,以表彰他们对我们理解复杂物理系统的开创性贡献。他们在气候和其他复杂现象中发现了隐藏的模式,三位获奖者因对混沌和明显随机现象的研究而分享了今年的诺贝尔物理学奖。以下来自nobelprize的报道:复杂系统的特点
算法信仰的力量:改进算法能提升多少性能?
与硬件的摩尔定律相比:摩尔定律的硬件改进会随着时间的推移顺利进行,而对于算法而言,带来的收益虽然会很大但是发生的概率机会很小。为了让人们坚信对算法的信仰,麻省理工学院计算机科学与人工智能实验室 (CSAIL) 的科学家开始研究:算法改进能提升多少性能?该团队着手处理来自 57
一张图说清AI、机器学习和深度学习在企业中作用
下面一张图通俗易懂地结束AI、机器学习和深度学习三者关系,和在企业实践中实际作用。
十个基础图论算法介绍 - Franc0
10个基本的图算法:bfs广度优先搜索:这是一种遍历算法。它从给定的顶点开始,并在移动到下一层的顶点之前探索当前级别的所有邻居。它是使用队列数据结构实现的。用途: 确定未加权图中的最短路径和最小生成树 构建网页
通俗易懂解释什么是PCIA(主成分分析) - stackexchange
假设我们的桌子上放着一些酒瓶。我们可以通过颜色、酒度、酒龄等来描述每种酒,而对于酒窖中每种葡萄酒如果用这些不同特征组成完整的清单。其中很多相关属性将是多余的。如果可以,我们应该可以用较少的特征来总结每种葡萄酒!这就是 PCA 所做的。PCA 不是选择某些特征而丢弃其他特征。相反,它构
机器学习不是研究因果逻辑的 - yudapearl
大多数 ML 研究人员都缺少两个基本点:(1) 一旦有了因果模型,所有好的好处(例如,可解释性、迁移学习、公平性、数据融合等)都是可行的。(2) 但是没有一个可行的因果模型。深度学习DL = 戴着手铐的上帝的大教堂。 注:机器学习是学习相关性
数据科学领域的几个无代码分析工具介绍
“数据分析”一词已成为 Python 和 R 等编程语言的同义词。虽然这些强大的语言对于使用最新最好的算法进行高级分析是必不可少的,但它们并不是开始分析复杂数据集所必需的!数据分析软件可以是开源的(橙色),也可以是与之相关的免费版本(RapidMiner)。下面推荐几款替代商业软件的
NLP 中不同词嵌入技术的比较 - KDnuggets
如果计算机可以开始理解莎士比亚,这不是令人难以置信吗?还是像 JK 罗琳那样写小说?这在几年前是不可想象的。url=https://www.ibm.com/cloud/learn/natural-language-processing]自然语言处理[/url
Anovos解决了机器学习中数据的漂移和稳定性 – thenewstack
mobilewalla已经发布了一个新的#Opensource项目:Anovos,它可以用来创建功能设计一个高效的数据管道,从摄入到功能创建和存储。在Mobilew
幽默:Github上两个机器人吵架了
企业数据状态混乱之原因与对策:引入DDD - Allamaraju
由于多种原因,企业中数据状态混乱,四个方面很突出:跨组织边界的零散所有权和问责制:信息孤岛、筒仓。数据库管理和数据工程等特定功能的集中化,但在整个企业游戏中没有一块完整的皮肤可用技能不平衡——软件开发团队很少将数据视为他们服务的一部分,数据
Facebook AI 相似性搜索 (Faiss)快速上手手册 - pinecone
Facebook AI 相似性搜索 (Faiss) 是最流行的高效相似性搜索实现之一。Faiss 是一个由 Facebook AI 开发的
通俗易懂讲解ML中的均方误差 (MSE) - haltakov
均方误差 (MSE)是用来测量预测值Ŷ与某些真实值匹配程度。MSE 通常用作回归问题的损失函数。例如,根据其属性估算公寓的
HDF5数据格式不适合深度学习 - KDnuggets
在本文中,我们将讨论 HDF5 是最流行和最可靠的非表格数字数据格式之一。但是这种格式并未针对深度学习工作进行优化。本文建议应该采用什么样的 ML 原生数据格式才能真正满足现代数据科学家的需求。
成熟机器学习系统持续改进面临的问题 - danshiebler
任何在大公司建立机器学习模型的人都会认识到。对成熟的机器学习系统进行可衡量的改进是极其困难的:机器学习系统极其复杂,并且具有破坏软件组件之间抽象的令人沮丧的能力。这对 ML 成功必不可少的迭代开发类型提出了广泛的挑战。 大多数软件系统会仔细控制哪些层需要相互通信以及需
用于训练自然语言处理 (NLP) 和文本模型的 7 个顶级开源数据集 - KDnuggets
以下列表是我们推荐的一些开始学习 NLP 的最佳开源数据集,或者您可以尝试各种模型并遵循这些步骤。 1.
泛化的第一性原理 - KDnuggets
我们现在看到的大多数机器学习 (ML) 论文都专注于推进不同领域的新技术和方法,例如自然语言或计算机视觉。尽管缺乏机器智能的基本理论,但 ML 研究仍在以疯狂的速度推进。ML 中的一些主要问题,例如如何理解神经网络如何学习或如何量化知识泛化,仍未得到解答。我们不时会遇到一些论文,这些论文以新
上页
下页