HIVE

     
    15

Uber如何实现互联网大规模金融交易的自动化审计?

354 4K

假设乘客于 2022 年 1 月从家到机场,费用为 60 美元。6-7 个月后,乘客再次从家到机场,但现在需支付 50 美元。在这两次行程中,乘客都使用了具.

Apache Iceber能将Amazon S3 成本降低了 90%

1095 4K

与Apache Hive 相比,新一代.

danthelion/trino-minio-iceberg-example:使用Minio、Trino、iceberg搭建数据工程演示案例

1704 1

这个项目演示了使用Minio、Trino(具有众多连接器)等工具通过 Docker 在我们的机器上部署 MVP 版本来运行一些分析查询. .

数据湖表格式比较(Iceberg、Hudi 和 Delta Lake)

2923 5K

表格格式是数据工具和语言与数据湖进行交互的方式,就像我们与数据库进行交互一样。表格格式允许我们将不同的数据文件抽象为一个单一的数据集,一个表格。 .

Hive性能调优实践 - Vidhya

1138 5K

Apache Hive 是一个建立在 .

Apache Impala 架构

723

Impala 是一个大规模并行查询引擎,可在现有 .

大数据文件格式比较:AVRO vs. PARQUET vs. ORC

2519 3K

为什么我们需要不同的文件格式?对于 MapReduce 和 Spark 等支持 HDFS 的应用程序而言,一个巨大的瓶颈是在特定位置查找相关数据所需的时间以.

Apache Hive 面试问答题

999 3K

在这篇博文中,我们将看看面试中出现的一些最常见的 apache hive 面试问题和答案。 1. 什么是Apache Hive? .

Hive 面试问题

731 7K

什么是Hive? Hive是适用于 .

Hive数据格式转换

1068 9K

Apache Hive支持许多文件格式,用于存储表格数据。有关 更多信息,请参阅以下 .

Apache Spark和Hive有用的功能

979 14K

尝试Spark和Apache Hive的一些方法和功能。 1. Spark和countByValue函数 让.

Trivagoj为何从Hive/SQL迁移到PySpark/Python?

980 9K

Trivago是一个以拍卖为基础的市场。广告商可以通过拍卖购买指定酒店的查询结果页面中的重要位置,trivago的拍卖机制将几个因素:价格、点击率和出价本身.

数据统计技术选型

1 869

最近进入一家互联网公司做数据分析,公司共有两个项目:A和B。A:40万条数据/天。B:1000万条数据/天。二者日志存储格式是每行一个JSON字符串,如{“ip”:.

    15