是什么让数据分析师变得优秀?- Cassie Kozyrkov


数据分析师查找事实并为您提供灵感,同时试图在此过程中尽可能少地浪费自己的时间(以及您的时间!)。为了获得最佳的灵感回报,他们必须掌握许多不同形式的速度,包括:

  • 获取有希望且相关的数据的速度。(领域知识。)
  • 准备好数据以进行操作的速度。(软件技能。)
  • 汇总数据的速度。(数学技能。)
  • 将数据摘要输入他们自己的大脑的速度。(数据可视化技能。)
  • 将数据摘要输入利益相关者大脑的速度。(沟通技巧。)
  • 让决策者受到启发的速度。(商业头脑。)

精美的可视化和有效传达的琐事是在浪费您的时间;令人兴奋的发现结果被误解是浪费你的时间;对垃圾数据源进行细致的尝试是在浪费您的时间;无关的轶事是在浪费你的时间;分析师带给您的任何您认为不值得您花时间的东西……都是浪费您的时间。
 
分析游戏就是关于优化每分钟灵感。

不要被对速度的简单解释所迷惑。一个邋遢的分析师不断地沉迷于闪亮的胡说八道“洞察力”,从长远来看只会让每个人都慢下来。
 
评估分析师绩效
对于那些喜欢绩效评估的人,请注意,您不能使用每分钟灵感来衡量您的分析师。
这是因为可以提取的最大灵感量(由决策者主观定义)因数据集而异。但是你可以通过让他们在你已经非常熟悉的基准数据集上放松来评估他们的技能(而不是工作表现)。
打个比方,如果你让两个分析师从一本外语教科书中提取灵感,那么更好(更快)的分析师可能是该语言的母语人士。你可以通过衡量他们理解你用该语言写的段落的速度来评估他们的相对技能。
 
Byteboard是一家革新技术面试的创业公司,他们最近推出了一项数据分析技能评估。它使用真实场景和漂亮的界面来衡量数据探索、数据提取、定量交流和业务分析等任务的能力。当然,他们打算将其作为帮助您面试新候选人的一种方式,但是您没有理由不能也使用它来快速测试您的现任分析师。
 
技能并不能保证影响力。这取决于你的数据。

如果你将两位分析师都指向一本你从未打开过的神秘教科书,你就不能让他们对他们发现的每分钟灵感负责,因为这本书可能充满了垃圾。如果是这样的话——不管他们的流利程度如何!——没有人会找到任何灵感来带给你……这不是他们的错。有一本教科书并不意味着你会学到一些有用的东西。数据集也是如此;它们的质量和相关性同样重要。
教科书是数据集的一个很好的类比,因此关于数据集和教科书还有几点需要牢记:

  • 一个决策者的垃圾可能是另一个决策者的宝藏。与教科书一样,数据集仅在涵盖您想了解的主题时才对您有用。
  • 如果它有一个人类作者,它是主观的。与教科书一样,数据集也有人类作者,其偏见会影响内容。

   
数据分析与统计
数据分析是关于计算统计数据的学科,但统计数据是超越这些统计数据的学科。
“统计”是在不确定性下改变主意的科学。
因此,如果您正在处理不确定性(例如“这个机器学习系统是否可以处理明天的数据?”)并且选项在尊严上并不相同(例如“我们可能不应该启动它,除非它有效。”)。来对地方了:统计数据适合您。
数据分析师应该知道的统计术语,包括样本、总体、观察、统计、参数、估计和假设。