Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
数据科学教程
通过语言的暗喻发现隐藏的DDD模型 - verraes
这是DDD专家 Mathias Verraes和
通俗易懂讲解ML中的均方误差 (MSE) - haltakov
均方误差 (MSE)是用来测量预测值Ŷ与某些真实值匹配程度。MSE 通常用作回归问题的损失函数。例如,根据其属性估算公寓的
复杂性系统的战略分析要点 -Dave
任何规划过程都必须允许变化,但太多的变化最终是不可改变和无法计划的。关键不在于数据的捕获或分析,而是如何让正在做决策的人尽早关注异常情况以做出更好的决策上下文就是一切,但我们也需要自动化(这是算法帮助的地方)来触发警报并触发足够的视角多样性以使任何决策具有弹
企业数据状态混乱之原因与对策:引入DDD - Allamaraju
由于多种原因,企业中数据状态混乱,四个方面很突出:跨组织边界的零散所有权和问责制:信息孤岛、筒仓。数据库管理和数据工程等特定功能的集中化,但在整个企业游戏中没有一块完整的皮肤可用技能不平衡——软件开发团队很少将数据视为他们服务的一部分,数据
2021年是巨大AI模型年 - technologyreview
当 OpenAI在 2020 年 6 月发布 GPT-3 时,神经网络对语言的明显把握是不可思议的。它可以生成令人信服的句子,与人类交谈,甚至自动完成代码。但 GPT-3 的影响在 2021 年变得更加明显。 今年带来了由多家科技公司和顶级 AI 实验室构建的大型 AI 模型的激增,许多模型
机器学习不是研究因果逻辑的 - yudapearl
大多数 ML 研究人员都缺少两个基本点:(1) 一旦有了因果模型,所有好的好处(例如,可解释性、迁移学习、公平性、数据融合等)都是可行的。(2) 但是没有一个可行的因果模型。深度学习DL = 戴着手铐的上帝的大教堂。 注:机器学习是学习相关性
Polars:用于 Rust 和 Python的快速数据整理DataFrame库
Polars 是一个闪电般快速的 DataFrame 库/内存查询引擎。高并行执行、高效缓存算法和富有表现力的 API 使其成为高效数据整理、数据管道、快速 API 等的完美选择。Polars 是一个在 Rust 中实现的极快的 DataFrames 库,使用
数据科学领域的几个无代码分析工具介绍
“数据分析”一词已成为 Python 和 R 等编程语言的同义词。虽然这些强大的语言对于使用最新最好的算法进行高级分析是必不可少的,但它们并不是开始分析复杂数据集所必需的!数据分析软件可以是开源的(橙色),也可以是与之相关的免费版本(RapidMiner)。下面推荐几款替代商业软件的
如何使用传统数据库思维进行实时数据流分析? – thenewstack
大多数流数据技术需要开发人员的思维方式不同于使用传统关系数据库的思维方式。但是现在,专注于时间序列数据库的初创公司Deephaven Data Labs发布了Deep
2022年面向专业人士的 10 大大数据分析工具
文字不足以说明数据的重要性以及将其转换为有助于改进决策的形式的需要。当您拥有合适的数据分析工具时,将原始数据转换为有助于管理层做出更好决策的形式并不是一项艰巨的任务。这就是为什么依靠良好的数据分析工具至关重要。关于这一点,请查看 2022 年面向专业人士的 10 大大型分析工具。 <
分析工程师 – 数据团队中的新角色 - KDnuggets
在不断变化的环境中,对于许多公司,数据工程师、分析师和数据科学家的角色和职责正在发生变化,这迫使我们引入一个新角色:分析工程师。分析工程师处于数据科学家、分析师和数据工程师技能集的交叉点。他们为分析师和数据科学家的工作带来了正式而严格的软件工程实践,他们为数据工程的工作带来了分析和业
Anovos解决了机器学习中数据的漂移和稳定性 – thenewstack
mobilewalla已经发布了一个新的#Opensource项目:Anovos,它可以用来创建功能设计一个高效的数据管道,从摄入到功能创建和存储。在Mobilew
能源和公用事业领域的 10 大数据科学用例 - KDnuggets
能源部门和公用事业的快速发展直接影响着社会发展。人们现在面临着能源智能管理和消费、可再生能源应用和环境保护的挑战。智能技术在这些问题的解决中发挥着至关重要的作用。在本文中,我们将考虑能源和公用事业行业中最生动的数据科学用例。机器学习算法、分析模型和大数据解决方案可帮助公司管理和有效利
用于训练自然语言处理 (NLP) 和文本模型的 7 个顶级开源数据集 - KDnuggets
以下列表是我们推荐的一些开始学习 NLP 的最佳开源数据集,或者您可以尝试各种模型并遵循这些步骤。 1.
首席数据官需要确保战略方向 - snowflake
几年前,一位首席数据官CDO问我:“一美元的成本节省与一美元的收入是一样的吗?” 我的回答是响亮的“不”。数据和分析计划必须与业务目标保持一致。如果一家公司处于增长模式,一心想抓住思想和市场份额,洞察团队会优先考虑创收而不是成本节约。在经济低迷时期,当生存模式启动时,优先事项可能会有所不同。
成熟机器学习系统持续改进面临的问题 - danshiebler
任何在大公司建立机器学习模型的人都会认识到。对成熟的机器学习系统进行可衡量的改进是极其困难的:机器学习系统极其复杂,并且具有破坏软件组件之间抽象的令人沮丧的能力。这对 ML 成功必不可少的迭代开发类型提出了广泛的挑战。 大多数软件系统会仔细控制哪些层需要相互通信以及需
研究表明:用于机器学习的数据集正在被影响垄断 - Unite.AI
构建一个好的数据集需要付出大量的努力,如果它变得更大,则比例更大,人们喜欢大数据集,因为您可以从中训练出更强大的模型。因此,人们倾向于被资金充足的机构制作的数据集所吸引。加州大学和谷歌研究中心的一篇新论文发现,少数“基准”机器学习数据集,主要来自有影响力的西方机构,经常来自政府组织,
Hadoop中的职业机会
Hadoop 是基于 JAVA 的框架,用于存储和高效处理大型数据集。换句话说,该工具是一组开源实用程序,以其巨大的处理能力促进海量数据的存储和处理。该技术允许多个设备分析数据集,而不是使用一台计算机来处理数据。Apache Hadoop 带有两个子组件,如下所示 -
上页
下页