面试一个需要sql的职位你可能会遇到的问题:
1. 非常一般的问题:
- 谈谈你曾经解决过的一个困难问题
- 谈一谈你作为一个团队工作的时间
- 谈谈你独自解决一个问题的时间
- 你是否用过<这里是面试公司使用的产品/服务>?
- 在以前的工作中,你遇到过哪些与<面试公司工作中描述的问题>类似的挑战?
2. 更加针对ETL。
- 你可以做些什么来加快从<这个RDBMS/NAS/API/whatever>到<这个RDBMS/NAS/whatever>的数据传输?
- 解释一下<这里是具体数据库功能>。
*你会如何设计一个模式来存储*这个*?
3. 更具体的分析。
- 我可以做什么来改善*这个特定的查询*?
- 描述一下<这里本行业特有的常见数据类型>。
- 你将如何向客户展示这些数据,或者为下游的工程师/操作人员打包?
非常重要的是,你也要准备好问题--不仅仅是关于他们使用的工具和他们做事的方式,更多的是你可以期待的管理、合作实践、对远程工作的开放程度等等。
如果进展顺利,随着时间的推移,谈话会变得更加随意,你和你的面试官会开始相处得更好,压力也会变小。理想的情况是,他们喜欢你,足以让你留在身边 :)
请记住,在与数据相关的工作中,行业知识是非常重要的,也是非常受欢迎的,因为这意味着他们不需要教你那么多,而且你更有可能对他们的产品或代码库做出新的贡献。例如,找到一个能够编写API来分发复杂的医疗数据的工程师是一回事,但找到一个能够做到这一点并且**已经熟悉数据的性质、常见的数据规格以及围绕它的典型客户期望的工程师又是另一回事。
数据分析面试题案例
有一组美国的COVID数据(公众很容易下载),并在MySQL+Excel中工作。
用这个数据集给我们讲一个故事。(这是为了看你是否有表达能力来清楚地解释你的想法。在成为DA时,这比技术能力更重要,甚至更重要。)
- 你如何计算加州在数据集中出现的次数?(基本上只是一个基本的COUNT()函数)
- 你如何不把加利福尼亚和内布拉斯加包括在这个列表中?(使用NOT IN函数)
- 你能告诉我们哪些州的COVID正面案例最多,哪些最少(GROUP BY, ORDER by DESC)。
- 你如何将问题4中的前五个州限制在其中?(Limit 5)
- 假设你有一个customers表和order tablkes。你想要所有来自客户的记录。你会怎么做(左键连接)
- 解释一下左连接、右连接、内连接和外连接的区别。
- 对windows函数的经验。
- 你知道哪些最先进的Excel函数(我说VLOOKUPS、HLOOKUPS、INDEX、透视表,笑了。他们说这很好,而且Excel的使用量也不是很高。我想说的是,我每周大约有10%的时间会用到它)
- 你对触发器或创建表格有什么经验吗(我知道如何创建基本的表格和触发器是什么)?
- 是否使用过临时表、CTE或子查询(我是诚实的... 我也许用过一次,只是为了练习。3个月后,我就知道这些是什么了,哈哈)。
10个Tableau问题诸如:你什么时候会使用柱状图与线状图,措施与维度,KPI解释,实时与提取,等等。