• 与硬件的摩尔定律相比:摩尔定律的硬件改进会随着时间的推移顺利进行,而对于算法而言,带来的收益虽然会很大但是发生的概率机会很小。为了让人们坚信对算法的信仰,麻省理工学院计算机科学与人工智能实验室 (CSAIL) 的科学家开始研究:算法改进能提升多少性能?该团队着手处理来自 57
  • 2021 年诺贝尔物理学奖联合授予真锅秀郎、克劳斯·哈塞尔曼和乔治·帕里西,以表彰他们对我们理解复杂物理系统的开创性贡献。他们在气候和其他复杂现象中发现了隐藏的模式,三位获奖者因对混沌和明显随机现象的研究而分享了今年的诺贝尔物理学奖。以下来自nobelprize的报道:复杂系统的特点
  • 任何规划过程都必须允许变化,但太多的变化最终是不可改变和无法计划的。关键不在于数据的捕获或分析,而是如何让正在做决策的人尽早关注异常情况以做出更好的决策上下文就是一切,但我们也需要自动化(这是算法帮助的地方)来触发警报并触发足够的视角多样性以使任何决策具有弹 icon
  • 大多数 ML 研究人员都缺少两个基本点:(1) 一旦有了因果模型,所有好的好处(例如,可解释性、迁移学习、公平性、数据融合等)都是可行的。(2) 但是没有一个可行的因果模型。深度学习DL = 戴着手铐的上帝的大教堂。  注:机器学习是学习相关性 icon
  • 均方误差 (MSE)是用来测量预测值Ŷ与某些真实值匹配程度。MSE 通常用作回归问题的损失函数。例如,根据其属性估算公寓的 icon
  • 优步Uber提供按需出租车服务,只需按一下按钮。在本文中,我们将探讨 Uber 背后特定功能的工程设计。 计算预计到达时间当你拿出你的手机;打开优步应用并叫车,然后那些聪明的小算法会告诉你司机需要多长时间才能到达。预计到达时间在大多数 icon
  • 由于多种原因,企业中数据状态混乱,四个方面很突出:跨组织边界的零散所有权和问责制:信息孤岛、筒仓。数据库管理和数据工程等特定功能的集中化,但在整个企业游戏中没有一块完整的皮肤可用技能不平衡——软件开发团队很少将数据视为他们服务的一部分,数据 icon
  • “数据分析”一词已成为 Python 和 R 等编程语言的同义词。虽然这些强大的语言对于使用最新最好的算法进行高级分析是必不可少的,但它们并不是开始分析复杂数据集所必需的!数据分析软件可以是开源的(橙色),也可以是与之相关的免费版本(RapidMiner)。下面推荐几款替代商业软件的 icon
  • 相关性:通过了解A我们可以预测B;因果性:通过改变A我们可以控制B。相关性比因果关系弱,但仍然非常有用。 icon
  • 在数据仓库应用程序中,我们需要想办法有效地回填我们的数据并大规模快速运行我们的 SQL。回填是指我们想要在表中填充过去 X 天的数据。为此,我们的 SQL 必须是可重复和可水平扩展的。我们需要以不会泄漏数据或导致重复的方式一次填充数天的数据。以下是实现这一目标的一些技巧。 < icon
  • 大多数流数据技术需要开发人员的思维方式不同于使用传统关系数据库的思维方式。但是现在,专注于时间序列数据库的初创公司Deephaven Data Labs发布了Deep icon
  • 在不断变化的环境中,对于许多公司,数据工程师、分析师和数据科学家的角色和职责正在发生变化,这迫使我们引入一个新角色:分析工程师。分析工程师处于数据科学家、分析师和数据工程师技能集的交叉点。他们为分析师和数据科学家的工作带来了正式而严格的软件工程实践,他们为数据工程的工作带来了分析和业 icon
  • 软件系统是社会技术的,当我们从社会技术角度看待软件时,我们开始意识到软件开发和运营中固有的复杂性。我们正在构建和运行的系统不断被不同的人修改,在不同的背景下,在不同的时间,他们可能会也可能不会直接与你沟通交流这种变动。这种紧急的协作可以带来独特的挑战。在我职业生涯的早期,我认为软件系 icon
  • 以下列表是我们推荐的一些开始学习 NLP 的最佳开源数据集,或者您可以尝试各种模型并遵循这些步骤。 1.  icon
  • 人工智能AI在自动驾驶汽车、社交媒体甚至医疗保健领域出现明显挫折。扎克伯格和马斯克都在努力解决一些大问题,这些问题至少部分源于对交付不足的人工智能系统的信任。扎克伯格正在处理无法阻止有害内容传播的算法;马斯克的软件尚未以他经常承诺的方式驾驶汽车。准备使用AI的公司应该考虑专注于培养高 icon
  • 一场强大的颠覆即将来临;也许,这是自 1964 年计算机化事务处理发明以来最强大的。预测事务处理即将颠覆过去 57 年的计算模式,并改变我们的生活、工作、购物和娱乐方式。为了使企业保持相关性和竞争力,他们不仅需要能够预测客户的行为和偏好,还需要依靠预测性交易来实现大部分业务交互的自动 icon
  • 几年前,一位首席数据官CDO问我:“一美元的成本节省与一美元的收入是一样的吗?” 我的回答是响亮的“不”。数据和分析计划必须与业务目标保持一致。如果一家公司处于增长模式,一心想抓住思想和市场份额,洞察团队会优先考虑创收而不是成本节约。在经济低迷时期,当生存模式启动时,优先事项可能会有所不同。 icon
  • 任何在大公司建立机器学习模型的人都会认识到。对成熟的机器学习系统进行可衡量的改进是极其困难的:机器学习系统极其复杂,并且具有破坏软件组件之间抽象的令人沮丧的能力。这对 ML 成功必不可少的迭代开发类型提出了广泛的挑战。 大多数软件系统会仔细控制哪些层需要相互通信以及需 icon