请教banq老师银行成本分摊千万级数据量处理问题
项目概述:xx银行是通过ETL从核心业务系统中提取业务数据、并转换成SAP R3 系统中对应的业务数据。SAP R3 系统业务数据输出到SAP BW 数据仓库中进行数据建模,最后通过SAP BO 报表形式呈现。
SAP R3本身存在的成本分摊功能由于涉及数据量太大,导致分摊性能非常低。现在客户提出需要使用Java来读取 SAP 和ETL中的数据,并进行成本分摊、并输出到BW数据仓库中,最终由SAP BO 来报表呈现。
成本分摊包括机构之间的分摊和PA分摊。也就是部门之间分摊完毕,再分摊到接收方纬度组合的业务线上,分摊的业务数据高达千万级。
sap系统自带的成本分摊功能需要三天才可以完成分摊,客户要求能够缩短分摊时间,提高分摊性能。
目前需要做的工作:
1.读取SAP系统原有成本相关数据,并导入到现有数据库中。(数据量可达千万级)
2.将导入成功的部门成本数据按照分摊规则,分摊到上百万级的业务线上
3.将分摊的所有业务线的数据输出。
客户坚决要求使用Java来实现,个人认为跟语言没有关系,主要是对高数据量读取导入、以及分摊的过程性能优化。
请banq老师,给一些具体的解决方案。谢谢。