低质量数据损害业务绩效 - hu


数据质量问题的具体成本因业务而异,因垂直而异。但是,平均而言,低质量数据使组织每年损失约 1300 万美元(Gartner,2021 年)。

数据质量的影响
除了上面那个可怕的大数字之外,你应该如何考虑数据质量对你的业务的影响?答案取决于两件事。

  1. 数据本身的质量。虽然完美的数据在现实世界中并不存在,但你应该能够确定对你的公司来说 "足够好 "的数据是什么样子。
  2. 组织如何全面使用数据。没有单一的 "正确方式 "来使用数据。相反,你应该创建数据管理的最佳实践,对你独特的使用情况有意义。

例如,在B2B SaaS公司中,不正确的客户数据可能导致错误,如在错误的时间向某人发送不相关的产品推荐。这损害了你以客户为中心的声誉,从长远来看,可能会使你失去收入。然而,对于医疗行业的公司来说,不正确的客户数据可能会导致开出一种引发致命反应的药物,严重伤害了病人,并引发一场诉讼以及大量的负面宣传。

从这个例子中,我们可以看到,在一种情况下(B2B)糟糕的数据质量是重要的,但不是致命的。换句话说,有更多的错误空间。而另一方面,处理医疗数据的数据团队则需要更严格的数据质量护栏。这是说。不是所有的数据质量后果都是一样的。语境很重要。

下面,我将解释:

  • 公司使用数据的四种主要方式
  • 你可以用三部分框架来确定数据质量如何影响你的组织的业务绩效
  • 如何预防和解决数据质量问题(在它们影响你的业务之前)。

司使用数据的四种主要方式
大多数公司使用数据的方式有四种:忽略数据、将数据用于运营、将数据用于战略参考、或将数据作为产品出售。

除了忽略数据外(没有不使用数据的 "好 "方法),数据质量影响着所有这些方法。高质量的数据是一个竞争优势,而低质量的数据充其量是一个障碍。让我们仔细看看这些数据的使用都需要什么。

  • 完全不使用数据。尽管 "数据驱动 "的组织被炒得沸沸扬扬(以及高质量数据带来的竞争优势),但这种情况却出奇地普遍。没有一个好的方法可以完全不使用数据,所以这是名单上的一个异类。
  • 将数据用于运营目的。这包括内部操作,如分配广告支出和外部操作,如客户沟通。高质量的数据可以帮助你的营销团队锁定最有可能购买的人,帮助你的物流团队有效地运输产品,并帮助你的客户成功团队提供个性化的服务,从而创造出狂热的粉丝。应用得好,高质量的数据可以使收入最大化,同时使成本最小化。
  • 使用数据来影响内部产品决策和市场战略。拥有最佳数据的竞争者会得到第一手的机会。有了可靠的、高质量的数据,产品团队可以跟踪趋势,并率先开发客户需要的功能。当风向发生变化,是时候改变方向时,他们也会有预见性。好的数据可以帮助你的公司在最有利的时候做出市场行动。
  • 把数据作为产品来使用和销售。如果你从事的是销售第三方数据的业务,数据质量的重要性是显而易见的。一个干净、安全、可靠的产品可以提高客户的满意度和保留率,减少法律责任,并使你站在监管机构的正确一边。

当你把它归结为,每个垂直领域的每个企业都做三件事:花钱、赚钱和承担风险。当你把数据与这些活动之一联系起来的时候,数据的质量就变得至关重要了。

如果你的企业在任何方面使用数据,数据质量就会影响企业的业绩。唯一的问题是如何影响。

一个由三部分组成的框架来确定数据质量如何影响你的业务
我们很容易看到糟糕的数据质量是如何影响其他公司的。

2021年,Zillow的机器学习算法的问题导致了超过3亿美元的损失。大约一年前,表行的限制导致英格兰公共卫生局少报了16000例COVID-19感染。当然,还有火星气候轨道器的经典警示故事,一个价值1.25亿美元的航天器因为公制和英制测量单位之间的差异而在太空中丢失。

要看到糟糕的数据质量如何影响你自己的公司(特别是如果你试图在出现大的公共问题之前改善数据质量),可能会感觉更有挑战性。我发现用一个三部分的框架来思考数据质量是很有帮助的。

1. 你根本不使用数据,所以数据质量并不重要。在这个层次的框架中,有两种企业--那些不使用数据的企业和那些不使用数据的企业(还没有)。随着现代数据基础设施的建立越来越可行,以及使用数据的企业开始获得竞争优势,第一阵营的企业正在迅速减少。

处于第二阵营的企业至少有一点是有利的:你可以从一开始就把数据质量保证纳入你的商业数据战略。虽然有可能将数据质量保证推迟到问题发生后,但最好是开始收集相关信息,以防止问题发生,并在问题(不可避免地)发生时最大限度地提高背景。

2. 你用数据来推动商业决策和战略,这意味着糟糕的数据质量的成本是一个错误的决策或失去信任的成本。例如,低质量的市场数据可能会导致你在一个收入中位数不够高的地区开设新的地点,以支持他们。或者,一个客户成功经理将有问题的数据分享给一个高价值的客户,如果他们对报告仪表板中的数据产生怀疑,那也是合理的。

像时间一样,战略决策和信任很容易失去,也很难重新获得。如果失去了对商业利益相关者的信任,数据团队就必须花费宝贵的精力来回答特别的要求并建立额外的保证。如果不能重新获得信任,利益相关者开始建立他们自己的 "影子 "数据栈是很常见的,这可能完全破坏了数据团队的目的。

3. 你使用数据来告知业务运营或产品体验,这意味着不正确的数据的代价是浪费时间和金钱或客户的信任。例如,不完整的客户数据会导致你的营销部门针对错误的买家,把广告预算花在一个无法转化的活动上。在最好的情况下,这导致浪费了开支和纠正问题的时间。在最坏的情况下,收到不相关或不正确信息的客户开始对公司的能力失去信任。

在最高层面上,企业的存在是为了增加收入、降低风险和减少成本。如果你的公司使用数据为运营或产品提供动力,那么你就处于令人羡慕的地位,将数据与公司的成功直接联系起来。然而,巨大的权力伴随着巨大的责任,这意味着数据质量失效的成本可能直接是现在与企业的其他功能一样重要,如果不是更重要。