六条数据战略管理的核心主题 - Nicole

22-04-04 banq

在这篇文章中讨论数据战略管理的六条核心主题:
  1. 数据治理
  2. 数据质量
  3. 数据架构
  4. 数据建模
  5. 主和参考数据管理
  6. 数据仓库和商业智能


数据治理
在开始数据战略工作时,要对组织的使命宣言和战略目标进行讨论。
将数据与业务成果联系起来,才能推动长期维持数据治理的动力。

需要考虑的其他过程。

  • 制定操作框架
  • 制定RACI矩阵
  • 进行成熟度评估
  • 进行差距评估
  • 制定带有过渡步骤的路线图

当我们开始讨论支持数据治理所需的组织结构时,值得记住的是,数据治理是一个过程,而不是一个项目,因此没有一个固定的结束日期。
重要的是,要通过设置 "角色和责任 "来保持连续性,这些角色和责任将超越任何特定的个人贡献者。

支持数据治理的组织结构:
  • 首席数据官
  • 指导委员会
  • 数据治理委员会
  • 项目办公室
  • 数据管理人工作小组

如何开始 ?以下是数据治理倡议的三个实用的初始步骤。
  • 首先,将与数据相关的利益和风险与组织的战略目标相结合。
  • 第二,建立一个长期的组织结构。
  • 最后,进行一次数据成熟度评估,包括在整个组织内进行关于数据文化的对话。这将帮助数据治理团队更好地了解围绕数据的态度和行为。你可以问这样的问题。数据是否在各业务部门之间自由共享?数据消费者是否有必要的技能和终端来访问他们工作中需要的数据?数据质量是否受到信任?

建立数据治理肯定需要时间和精力,但它是改善组织的数据基础设施的基础。它确实是开启其他潜在数据相关举措的关键,包括数据科学。

请记住,数据治理是一个持续的过程,而不是一个项目。

数据质量
与数据质量相关的  九个维度:准确性、完整性、一致性、完整性、合理性、及时性、唯一性/重复数据删除、有效性和可访问性。
数据应该适合于某种目的。它应该满足其作者、用户和管理员的要求。

如何开始?

  • 为了推进数据质量倡议,你应该首先建立一个正式的数据质量报告程序。在《精益创业》中,Eric Ries谈到了问5次 "为什么 "的重要性,以达到问题的根本原因。这个练习与调查数据质量问题和进行根本原因的补救有关。
  • 第二,你可以考虑对数据所有者以及整个组织的数据消费者进行数据素养培训。
  • 第三,大量的数据质量问题源于缺乏高质量的元数据,尤其是在数据湖的时代。数据有可能被加载到存储系统中,然后由于质量差的元数据标签而丢失。努力创建一个数据目录可能有助于解决这一挑战。


数据结构
这一领域代表了业务需求向技术规范的转化。架构描述了数据基础设施的当前和未来状态。企业数据模型和数据流图是构成数据架构骨干的关键工具。

企业数据模型是一个整体的、企业级的、与实施无关的概念或逻辑数据模型,为整个企业提供一个共同的、一致的数据视图。

数据流图定义了跨数据库、平台和网络的存储和处理的要求和主蓝图。

如何开始使用数据架构?

  • 开发一个企业数据模型(EDM),为整个组织提供一个一致的数据视图
  • 开发一个数据流图,定义跨数据库、应用程序、平台和网络的存储和处理的要求和蓝图


数据建模
建模为数据的连接方式提供了一个蓝图。

从概念数据模型开始,业务概念和活动被记录为实体和关系。
逻辑数据模型捕捉到详细的需求。这个阶段建立在需求和现有文件的基础上,增加关联实体。
最后,物理数据模型的开发概述了数据将如何存储在企业系统中。
一旦建模过程完成,团队可能会选择进行一个从物理模型到逻辑模型再到概念模型的逆向工程过程,以确保需求得到满足。

在大型企业中,经常有一种趋势是直接进入逻辑模型而完全跳过概念模型。然而,这是一个错误--从概念模型开始有很大的价值,因为它对整个团队对数据实体和关系的共同理解有很大帮助。

如何开始进行数据建模?

  • 选择方案和符号
  • 收集实体和关系
  • 利用组织特定的术语


主数据和参考数据管理
主数据是关于商业业务实体的信息。它被收集和保存为一个 "真理之源 "和整个组织的资源。这减少了在如何定义和识别关键实体方面的差异,并允许数据在业务功能和应用程序之间共享。它促进了共享数据模型和集成模式的标准。

同样地,参考数据指的是应该在整个组织内共享的数据。它通常是从外部来源收集的,它被用来为组织的功能和活动提供背景。

如何开始?

  • 计划在一个记录系统中的存储
  • 收集业务实体和文件数据
  • 建立一个持续监测的过程

主数据和参考数据提供了一种共同的语言,并强调了数据是整个组织的共享资产。

数据仓库和商业智能
数据仓库是一个特定的基础设施要素,它为数据消费者,如分析师和数据科学家,提供了对数据的访问,这些数据已被塑造为符合业务规则,并以易于查询的格式存储。

数据仓库通常连接来自多个 "真实来源 "的交易型数据库的信息。数据仓库的内容已经被重组,以达到快速和容易查询的目的。这有助于通过分区、索引和减少表连接的复杂性来提高性能。

商业智能通常表现为报告和仪表盘,为商业利益相关者提供洞察力。
商业智能往往会揭示企业中持续存在的所有数据质量问题。仅仅因为一个数据质量问题没有中断现金流,这并不意味着它没有暗中阻碍组织的战略目标。

这就是为什么通过创建治理和促进数据质量来启动数据战略工作是非常重要的,然后将流入有效的高级分析,如商业智能和数据科学项目。

如何开始使用数据仓库?

  • 首先,在设计时要考虑到目的,然后以敏捷的方式构建和交付。
  • 第二,在实施过程的最后阶段进行汇总和优化
  • 第三,通过透明的元数据交流和对数据消费者的教育,促进对数据的自助式访问。

如何开始使用商业智能?
  • 同样地,第一步是在设计时考虑到终端,然后在敏捷冲刺中构建和交付
  • 第二,在实施过程的最后阶段进行汇总和优化
  • 第三,通过透明的元数据交流和对数据消费者的教育,促进对数据的自助式访问。


总结
就像马斯洛的需求层次一样,如果不首先实现艾肯金字塔基础层的数据治理、数据质量和数据架构的生理和安全需求,就无法实现数据科学的实现。
了解了数据战略,你就会从一个数据消费者转变为一个有能力的倡导者,从而实现更好的数据管理实践。
数据战略的上述要素位于艾肯金字塔的顶端,在这里我们开始进入高级分析和机器学习等活动,这些活动可能比商业智能更复杂。