• 知识图不仅仅是一个知识库。它是一个图形说明,将组织的知识库反映为数据实体及其关系的数字网络。知识图谱的关键特性包括统一数据、集成数据源以及跨数据实体映射关系。 知识图谱已被证明对知识管理和数据分析具有革命性意义。知识图谱的主要用户包括希望从组织数据中发现有意义见解的行业。知识图能够以
  • 在我们深入了解什么是数字免疫系统(digital immune system)之前,让我们考虑一下免疫对一个生物体意味着什么。免疫力是指生物体对特定疾病的反应、回应和抵御能力,特别是对入侵的病原体的保护。  这通常是通过开发和部署对抗措施(又称抗体)来对抗外来入侵者来实现的。
  • 知识图结合信息以创建描述不同实体之间关系的互连网络。它们目前简化了我们的许多日常数字体验,支撑着谷歌搜索、社交媒体网站和流媒体推荐引擎等应用程序。凭借其定义复杂和重叠关系的能力,例如,在细胞水平上可视化蛋白质和分子之间发生的数百种相互作用,知识图谱在生命科学中具有丰富的应用。如果使用得当,它 icon
  • 将数据驱动文化引入组织的第一个关键步骤是将数据收集和分析要求嵌入到产品开发工作流程中。作者讲述了分析需求文档如何帮助定义更好的数据策略。 在推出任何新产品时,我们如何跨各方、团队和利益进行协调?以房地产为例:在房地产领域,如果没有准 icon
  • 1.鸵鸟效应我们经常试图避免那些我们担心会给我们带来压力的信息。因此,账单和工作邮件仍然没有被打开,银行余额仍然没有被检查。这是适得其反的,因为忽视一个问题并不能消除问题或你的焦虑,它只会延长它们。 icon
  • 在本文中,我们将了解模块化这一最重要的系统设计原则之一如何应用于 SQL。定义: 模块是一个单元,其元素与自身紧密相连,但与其他单元弱相连。 当系统在设计时考虑到模块化,独立方很容易并行构建这些组件,以便以后组装。它还使得在生产中调试和修复 icon
  • 使用 Apache Pinot、Kafka 和 Debezium 构建可扩展的分析基础架构以提供低延迟的面向用户的分析这篇文章将是一篇很长的文章。所以让我总结一下重要的事情。 什么是面向用户的分析? 面向用户的分析的商业价值是什么 为什么很难实现面向用 icon
  • 控制的错觉:是一种认知偏见,我们总是高估了我们对事件的控制程度。它描述了人类倾向于相信他们可以控制或至少影响结果,而事实上他们不能。当受到控制偏见的错觉时,人们会觉得他们对环境的控制力比他们实际能控制的多。例如,你和你的家人要去看你最喜欢的足球队的联赛冠军赛。像往常一样,你爸 icon
  • 在处理数据和分析用户与我们今天的产品的互动时,必须通过跟踪他们过去的行为来了解他们的行为,如打开通知、与博客互动或在平台上创建新的登录。在这种情况下,归因研究指的是将所有这些行为按特定模式组合在一起,以产生一个预期的最终结果的方法。 在本文的范围内 icon
  • 信用卡是一个传统系统。它们对全球商业极为重要,但表现出路径依赖。它们的大部分幕后运作都来自50多年前做出的设计, Stripe正在为每个人升级这个关键系统。 考虑一下信用卡欺诈的情况。信用卡最初设计的核心动机用例是:”一个商务旅行者,在远离 icon
  • 了解有关反向 ETL 的所有信息、它如何适应现代数据堆栈以及它与 ETL 的不同之处。 在过去的六年里,数据生态系统发生了巨大的变化,我们目睹了几种不同技术的兴衰。然而,有一个不变的东西保持不变:云数据仓库。 icon
  • 在过去十年中,实时报告对于根据最新数据做出决策变得非常重要。客户和产品团队要求报告包含实时数据,以便他们能够做出最新的明智决策。GumGum使用实时数据 (1) 在为我们的活动提供服 icon
  • 当您开始看到核心数据团队之外的整个团队都在从事类似数据团队的工作时,情况会更加复杂。这些人通常被引入从事关键业务工作,例如制作预测模型来确定哪些支持代理应该在何时工作或构建数据模型来确定客户的信用评分。 如果做错了,这些团队会带来数据可靠性下降的风险,并可能降低整个公司的决策质量。  icon
  • 如何将组织中的所有数据连接在一起,同时将数据还能留在原处? 什么是数据目录?Gartner 将数据目录定义为“通过发现、描述和组织数据集 [构建] 的数据资产清单。目录提供上下文,使数据分析师、数据科学家、 icon
  • Neobanking(新银行业务):在家中开设银行账户的便利性、24 小时支持的可用性以及无需跳过传统环节即可获得信贷的机会吸引了许多人。当然,这些都伴随着新的风险类型。然而,对于新的挑战,也有同样创新的解决方案,包括 icon
  • 在过去的十年中,数据工具有了 "寒武纪大爆炸"。每个数据工具都在不同的层面上解决了一个新的问题--但在我看来,"数据驱动的决策 "这个最终的问题与其说是由BI工具解决的,不如说是由人和流程解决的。 Creation > Ingestion > Wa icon
  • Auto Trader的CDP是一个专门构建的实时数据库,它从我们的行为数据平台Snowplow获取跟踪事件:每次客户与 Auto Trader 网站或我们的本 icon
  • 聚合数据能简化它,但让我们失去了信号和我们需要理解我们所看到的内容的上下文。 聚合是分析时间序列数据的标准最佳实践,但它会通过剥离关键上下文而产生问题,以至于您甚至不知道自己失去了多少潜在洞察力。在这篇文章中,我将首先讨论聚合如何成为问题,然后通过 icon