Hadoop常见面试题

22-01-09 banq

问:Hadoop 是用来做什么的? 
答: Hadoop 是一个开源软件框架,用于存储数据,然后在商用硬件组上运行应用程序。Hadoop 为任何类型的数据提供巨大的存储空间、强大的处理能力以及处理几乎无限并发任务的能力。
 
问:如何准备大数据面试? 
答:准备大数据面试可能因工作而异。但是,一些可以帮助您做好准备的技巧包括清楚地了解基础知识、了解听众、了解您的故事、准备好标准答案、提出好的问题、参加技术测试以及尽可能多地练习。
 
问:Hadoop 示例是什么?
答:资产密集型能源行业使用 Hadoop 支持的分析进行预测性维护。使用来自向大数据程序提供数据的物联网 (IoT) 设备的输入。金融服务、零售商、电信公司使用 Hadoop。
 
问:Hadoop 是 ETL 工具吗? 
答: Hadoop 不是 ETL 工具。它是一个 ETL 助手。这意味着它可以帮助您管理 ETL 项目。ELT 表示提取、转换和加载。ETL 适用于处理需要困难转换的较小数据集。
 
问:大数据的关键组成部分是什么?
A:大数据的核心组件包括摄取、转换、加载、分析和消费。
 
问:Hadoop 上的 SQL 是什么? 
答: SQL-on-Hadoop 是一类有条不紊的应用工具,它将已建立的 SQL 风格的查询与框架的最新 Hadoop 数据元素相结合。虽然它支持熟悉的 SQL 查询,但 SQL-on-Hadoop 支持更广泛的企业开发人员以及在商品计算组上使用 Hadoop 的业务分析师。
 
问:Hadoop 使用什么类型的系统?
答: Hadoop 是一种基于 Java 的开源集群文件系统应用程序,称为 HDFS。这使您能够进行经济高效、可靠且可扩展的分布式计算。HDFS 架构具有高度容错性,并且其设计方式可以在低成本硬件上使用。
 
问:Hadoop 在现实生活中是如何使用的?
答:现实生活中的 Hadoop 用于分析威胁生命的风险、识别安全漏洞的警告信号、防止硬件故障、了解人们对您公司的看法、了解何时销售某些产品、寻找理想的前景以及从您的日志文件。