• 锚定偏差(第一印象偏见:anchoring bias)是一种认知偏见,它导致我们过于依赖我们获得的关于某个主题的第一条信息。当我们制定计划或对某事进行估计时,我们会从锚点的参考点解释新的情况,而不是客观地看待情况。这可能会扭曲我们的判断,并阻止我们尽可能频繁地更新我们的计划或
  • 注意力偏差(attentional bias)描述了我们倾向于关注某些元素而忽略其他元素的倾向。研究表明,许多不同的因素会影响我们的注意力,从外部事件和刺激(例如对我们安全的感知威胁)到内部状态(例如饥饿或悲伤)。 比方说,你想改善你的饮食
  • 模糊效应(歧义效应:ambiguity effect)是一种认知偏差,描述了我们如何倾向于避免我们认为模棱两可或缺少信息的选项。我们不喜欢不确定性,因此更倾向于选择实现某个有利结果的概率已知的选项。(买涨不买跌) 想象一下,您正在注 icon
  • 为什么我们在做出快速决定时要依赖当前的情绪?(快思考、拍脑袋决策)情感启发式描述了我们在做决定时经常依赖我们的情感,而不是根据具体的信息决策。这种情感启发式能使我们能够迅速和容易地得出结论,但也可能扭曲我们的思维,导致我们做出次优的选择。 icon
  • 巴纳姆效应(barnum effect),通常也称为福尔效应,描述了个人何时认为可能适用于任何人的通用信息专门适用于他们自己。为何很多人相信星座? 巴纳姆效应的例子可以在我们周围看到。你是否在报纸上读过你的每日星座运势,并注意到预测是多么奇怪的准确 icon
  • 数据合规性是指组织确保所有敏感数据的管理和组织方式能够满足其业务规则以及法律和政府法规,而数据治理涉及使用内部设定的规则和政策来管理组织数据的可用性、安全性、可用性和质量的过程。 数据合规性涉及到个人信息的隐私以及企业和组织如何存储、检索和保护这些敏感数据。组织和企业,特别是 icon
  • 行动偏见描述了我们倾向于采取行动而不是不采取行动,有时候,我们感到不得不采取行动,即使没有证据表明这样做会比什么都不做带来更好的结果。我们把行动作为一种默认的、自动的反应,即使没有坚实的理由来支持,这种倾向也被称为行动偏见。 icon
  • 罗伯-派克(Rob Pike)是Go编程语言的设计者之一,也是贝尔实验室Unix团队的核心成员(他与Brian Kernighan合著了《Unix编程环境》)。 他还因其5条编程规则而闻名:你无法知道一个程序将在哪里度过它的时间。瓶 icon
  • 在这篇文章中讨论数据战略管理的六条核心主题:数据治理数据质量数据架构数据建模主和参考数据管理数据仓库和商业智能 icon
  • 为什么苏打水和冰淇淋都与暴力有关?本文就人们所说的“相关性并不意味着因果性”给出了最终结论。 苏打水和冰激凌与暴力有关?人们还从数据中得出结论:吸烟、巧克力和卷曲的薯条对你有好处。为什么会这样呢? icon
  • 探索一些用于数据分析的最强大的 Python 模块:如果你一直在寻找工作或从事大数据工作,你会知道公司越来越希望你有Power Bi、Tableau、SQL、MongoDB和Python的经验,以及微软Excel。但是,为了在市场上变得更有价值,你要先学哪一个呢? icon
  • 我经历了几个 "数据科学 "的面试过程,其中非常强调SQL/BI类型的技能。其中一家是T1-2公司,但同样,关于ML/统计学的问题为零,除了中级SQL之外,没有任何技术筛选。这是一个宏观趋势还是我只是找到了边缘案例? 我已经有几年没有在外面工作了, icon
  • 机器学习是 Lyft 应用程序的支柱,Lyft 的 Feature Serving 服务负责为这些 ML 模型提供特征数据。 Lyft 如何使用 Flyte 和 Apache Flink 存储特征定义并将特征数据提取到服务中。 Lyft 如何使用 Redis、Dyna icon
  • 数据工程比 DS数据科学 更受欢迎。不幸的是,ML(过度)工程是造成这种情况的一个原因。以前可以使用 crontab 和 15 行 shell 自动化模型;而现在,你需要在你的 XGBoost 模型后面有一大堆 Airflow、Kafka、Snowflake、Spark、Stitch icon
  • 大规模构建在生产中部署的推荐系统 ,并在用户等待页面加载时在几百毫秒内提供实时请求。要构建这样的系统,工程师必须做出跨越多个移动层的决策,例如: 高级范式(如协同过滤、基于内容的推荐、向量搜索、基于模型的推荐) ML 算法(例如 GBDT、SVD、多塔神经网络等) < icon
  • 我目前是一名数据科学家,我发现我的大部分时间都花在了特征工程上。 我的一般做法是,我创建数据的聚合(通过sql,因为需要处理的数据量很大),如sum,mean,avg,std,median,q25,q75。我需要在几十个特征上做这个工作。另外,我在 icon
  • 数据科学职业需要的三种职业技能: 1. 业务领域知识(业务逻辑) 2. 计算机科学知识(算法和数据结构) 3. 数学和统计知识 icon
  • 可以自动帮呢禁用网站上所有非必要的cookies,不必手动拒绝每个网址弹出的cookie警告。威斯康星大学麦迪逊分校和谷歌的一个研究小组声称,他们发现了一种利用人工智能来打击网络上普遍存在的操纵性cookie同意弹出窗口的方法。该项目被称为CookieEnforcer。 icon