数据科学教程 - 第14页

注意力偏差（attentional bias）描述了我们倾向于关注某些元素而忽略其他元素的倾向。研究表明，许多不同的因素会影响我们的注意力，从外部事件和刺激（例如对我们安全的感知威胁）到内部状态（例如饥饿或悲伤）。比方说，你想改善你的饮食

锚定偏差（第一印象偏见：anchoring bias）是一种认知偏见，它导致我们过于依赖我们获得的关于某个主题的第一条信息。当我们制定计划或对某事进行估计时，我们会从锚点的参考点解释新的情况，而不是客观地看待情况。这可能会扭曲我们的判断，并阻止我们尽可能频繁地更新我们的计划或

数据分析是检查数据以进行决策的过程；属于数据科学下的一个类别powerBi、Tableau、excel、SQL、python 都是获取数据分析结果的工具，是数据分析的工具。 PowerBI、Tableau、Excel 是用于分析/可视化带有图表和图形的数据集的工具。

模糊效应（歧义效应：ambiguity effect）是一种认知偏差，描述了我们如何倾向于避免我们认为模棱两可或缺少信息的选项。我们不喜欢不确定性，因此更倾向于选择实现某个有利结果的概率已知的选项。（买涨不买跌）想象一下，您正在注

为什么我们在做出快速决定时要依赖当前的情绪？（快思考、拍脑袋决策）情感启发式描述了我们在做决定时经常依赖我们的情感，而不是根据具体的信息决策。这种情感启发式能使我们能够迅速和容易地得出结论，但也可能扭曲我们的思维，导致我们做出次优的选择。

行动偏见描述了我们倾向于采取行动而不是不采取行动，有时候，我们感到不得不采取行动，即使没有证据表明这样做会比什么都不做带来更好的结果。我们把行动作为一种默认的、自动的反应，即使没有坚实的理由来支持，这种倾向也被称为行动偏见。

在这篇文章中讨论数据战略管理的六条核心主题：数据治理数据质量数据架构数据建模主和参考数据管理数据仓库和商业智能

探索一些用于数据分析的最强大的 Python 模块：如果你一直在寻找工作或从事大数据工作，你会知道公司越来越希望你有Power Bi、Tableau、SQL、MongoDB和Python的经验，以及微软Excel。但是，为了在市场上变得更有价值，你要先学哪一个呢？

数据工程比 DS数据科学更受欢迎。不幸的是，ML（过度）工程是造成这种情况的一个原因。以前可以使用 crontab 和 15 行 shell 自动化模型；而现在，你需要在你的 XGBoost 模型后面有一大堆 Airflow、Kafka、Snowflake、Spark、Stitch

大规模构建在生产中部署的推荐系统，并在用户等待页面加载时在几百毫秒内提供实时请求。要构建这样的系统，工程师必须做出跨越多个移动层的决策，例如：高级范式（如协同过滤、基于内容的推荐、向量搜索、基于模型的推荐） ML 算法（例如 GBDT、SVD、多塔神经网络等） <

数据科学职业需要的三种职业技能： 1. 业务领域知识（业务逻辑） 2. 计算机科学知识（算法和数据结构） 3. 数学和统计知识

可以自动帮呢禁用网站上所有非必要的cookies，不必手动拒绝每个网址弹出的cookie警告。威斯康星大学麦迪逊分校和谷歌的一个研究小组声称，他们发现了一种利用人工智能来打击网络上普遍存在的操纵性cookie同意弹出窗口的方法。该项目被称为CookieEnforcer。

机器学习是 Lyft 应用程序的支柱，Lyft 的 Feature Serving 服务负责为这些 ML 模型提供特征数据。 Lyft 如何使用 Flyte 和 Apache Flink 存储特征定义并将特征数据提取到服务中。 Lyft 如何使用 Redis、Dyna

数据合规性是指组织确保所有敏感数据的管理和组织方式能够满足其业务规则以及法律和政府法规，而数据治理涉及使用内部设定的规则和政策来管理组织数据的可用性、安全性、可用性和质量的过程。数据合规性涉及到个人信息的隐私以及企业和组织如何存储、检索和保护这些敏感数据。组织和企业，特别是

BI是企业的未来；ML是BI未来！现代ML与BI工具一起帮助公司利用大数据发挥潜力。借助 ML，BI 平台可以执行重要分析并适应不同的数据集。 BI商业智能历史第一次记录到“商业智能”是在 1865

这里提供您开始下一个数据科学项目所需的一切，包括数据集链接、教程以及如何最终将它们变成您自己的想法。 1.构建音乐推荐引擎百万歌曲数据集

问题：根据基础理论/数据分布，何时使用决策树而不是 SVM 或 KNN 更好？答案：1. xgboost在结构化数据和监督学习问题上很难被击败。相对特征规模不是问题，类不平衡不是问题，它可以处理空数据，而且由于决策树的性质，它在非

通过机器学习得到的结论是否需要引入领域专家意见？如果是，会产生两个手表时间不一致，到底听谁的问题；如果不是，机器学习也有自己的偏见，例如对黑白图片进行上色后，肯定无法原始的鲜艳颜色。讨论问题如下：你认为在机器学习过程中是否应该更多地咨询专家意见？如果有，在哪里？（也