HIVE
- 有
15贴
Uber如何实现互联网大规模金融交易的自动化审计?

假设乘客于 2022 年 1 月从家到机场,费用为 60 美元。6-7 个月后,乘客再次从家到机场,但现在需支付 50 美元。在这两次行程中,乘客都使用了具.
Apache Iceber能将Amazon S3 成本降低了 90%

与Apache Hive 相比,新一代.
danthelion/trino-minio-iceberg-example:使用Minio、Trino、iceberg搭建数据工程演示案例

这个项目演示了使用Minio、Trino(具有众多连接器)等工具通过 Docker 在我们的机器上部署 MVP 版本来运行一些分析查询. .
数据湖表格式比较(Iceberg、Hudi 和 Delta Lake)

表格格式是数据工具和语言与数据湖进行交互的方式,就像我们与数据库进行交互一样。表格格式允许我们将不同的数据文件抽象为一个单一的数据集,一个表格。 .
Hive性能调优实践 - Vidhya

Apache Hive 是一个建立在 .
Apache Impala 架构

Impala 是一个大规模并行查询引擎,可在现有 .
大数据文件格式比较:AVRO vs. PARQUET vs. ORC

为什么我们需要不同的文件格式?对于 MapReduce 和 Spark 等支持 HDFS 的应用程序而言,一个巨大的瓶颈是在特定位置查找相关数据所需的时间以.
Apache Hive 面试问答题

在这篇博文中,我们将看看面试中出现的一些最常见的 apache hive 面试问题和答案。 1. 什么是Apache Hive? .
Apache Pig:您需要了解的有关Hadoop编程语言的所有信息

Apache Hadoop .
Hive 面试问题

什么是Hive? Hive是适用于 .
Hive数据格式转换

Apache Hive支持许多文件格式,用于存储表格数据。有关 更多信息,请参阅以下 .
Apache Spark和Hive有用的功能

尝试Spark和Apache Hive的一些方法和功能。 1. Spark和countByValue函数 让.
Trivagoj为何从Hive/SQL迁移到PySpark/Python?

Trivago是一个以拍卖为基础的市场。广告商可以通过拍卖购买指定酒店的查询结果页面中的重要位置,trivago的拍卖机制将几个因素:价格、点击率和出价本身.
数据统计技术选型

最近进入一家互联网公司做数据分析,公司共有两个项目:A和B。A:40万条数据/天。B:1000万条数据/天。二者日志存储格式是每行一个JSON字符串,如{“ip”:.
- 有
15贴