优步如何使用 Databook 将元数据转化为洞察力?


优步写了一篇关于其运行 Databook 的经验的反映,并随着时间的推移对其进行了演变。该博客讲述了结构良好、管理良好的元数据、专注于用户体验的集中式元数据系统以及可扩展数据模型的重要性。

每天在全球 10,000 多个城市,数百万人依靠优步出行、订购食物和运送货物。我们的应用程序和服务可在超过 69 个国家/地区使用,并且每天 24 小时运行。在我们的全球范围内,这些活动会生成大量实时通过我们的系统运行的日志记录和操作数据。这包括有关消费者需求、驾驶员合作伙伴可用性以及其他运营任务(例如付款、通知等)的信息。运营像我们这样的复杂市场需要我们的工程师、数据科学家、数据分析师和运营经理根据我们平台上观察到的趋势做出实时业务决策。 
为了帮助我们的团队更轻松地发现和理解这些数据,我们构建了Databook。这是 Uber 的内部平台,用于显示和管理与数据集、内部仪表板、业务指标等各种数据实体相关的元数据。
随着 Uber 的扩张,我们的系统在技术上变得更加复杂,我们的数据系统的广度也呈指数级增长。同样,我们团队的需求也变得更加复杂,因为他们现在更加依赖数据集、仪表板和业务指标来在全球范围内做出业务决策。
Databook 无法扩展以满足这些新需求,这促使我们重新考虑我们的假设并重建我们的工具,以更好地支持我们的用户及其不断变化的需求。在这里,我们描述了我们如何改进我们的方法来简化数据发现和流畅性,以及我们在此过程中学到的教训。

详细点击标题