Dojo
最新
最佳
搜索
订阅
解道Jdon
架构设计
领域驱动
DDD介绍
DDD专辑
战略建模
领域语言UL
领域事件
商业分析
工作流BPM
规则引擎
架构师观点
数据工程
产品经理
系统思维
微服务
微服务介绍
微服务专辑
模块化设计
SOA
API设计
clean架构
SpringBoot
分布式事务
分布式架构
Kubernetes
DevOps
编程设计
GoF设计模式
模式专辑
面向对象
函数式编程
编程语言比较
编程工具比较
形式逻辑
前端编程
Reactive编程
Jdon框架
Rust语言
ChatGPT
Web3
模因梗
幽默梗
程序员吐槽
面试技巧
Java入门
数字化转型
认知偏差
道德经
GitHub工具
更多话题
数据的存储和查询分离不利查询性能 - thenewstack
22-05-07
banq
数据领域充斥着供应商、行业专家,甚至是记者,他们支持将存储和计算解耦的优点。毕竟,解耦的方法更容易独立地扩展计算和存储,它既适合云的业务模型,也适合其对象存储
架构
。
但这里有一点通常不会大声说出来:解耦存储通常不利于查询性能。如果您希望查询(尤其是可操作的查询)快速运行,则将数据定位在计算附近或计算数据所在的位置通常是更好的方法。
这正是Ocient在其同名的超大规模数据仓库的最新版本中所做的。它的架构使其计算和存储尽可能位于同一位置,该公司表示这会产生巨大的性能提升。
诚然,在一些部署中,将计算与存储解耦不仅是可行的,而且是最好的选择。通常情况下,这些应用对时间的敏感性较低,涉及的数据量较小,或者是由主流云数据仓库提供服务的工作负载的一部分,这些数据在任何情况下都可能缓存在与计算相邻的存储层。
但是,例如电信公司通常运行政策模型,确定第二天的流量路由规则。如果实现数据存储和查询分离:他们需要花几个小时来运行,因为这是一个巨大的机器学习模型。耦合计算和存储的顶级系统在几秒钟内完成这些工作。这种方式对于根据涉及天气、安全、体育比赛等方面的晚间突发事件来重新安排手机塔的流量是非常有价值的。
详细点击标题
分布式架构
数据工程