数据分析指南

     

数据中台的数据建模

1017 6K

我们探讨了数据建模在数据工程中的重要性、数据建模的历史以及数据日益复杂的情况。我们还谈到了理解数据格局的重要性、其挑战以及业务需求在推动成功的数据项目中的关键作用。坚实的数据建模基础可帮助组织创建高效.

什么是聚类错觉?

997

聚类错觉(Clustering Illusion)是指行为金融学中的一种认知偏差,在这种偏差中,投资者观察到的模式实际上是随机事件。换句话说,聚类错觉偏差是由于看到随机事件的趋势而产生的偏差,这些随机.

引发硅谷银行倒闭的蝴蝶效应

665 2K

这场灾难有可能是由Byrne Hobart的时事通讯自媒体引起的蝴蝶效应: 1)Byrne Hobart发表一篇文章/推特,揭露硅谷银行SVB的风险。 2)几乎所有VC都会阅读这篇通讯 3) 他们都开.

什么是破窗理论?

2495

破窗理论(Broken Windows Theory):在一个特定的环境中,如果有一个问题不被重视都会影响人们对这个环境的态度,并导致更多的问题。例如:城市花坛里如果有人第一个吐痰或扔了垃圾,那么就会.

使用机器学习进行预测

727 2K

时间序列预测是机器学习历史最悠久的应用之一,也是整个行业使用最普遍的技术之一(如果不是最普遍的话)。然而,在最近的 ML 热潮中,预测有些落伍了。时间序列预测正在成为一门失传的艺术。 它是美国零售业5.

什么是横向思维?

2014

通常,逻辑思维用于直接、直接地解决问题(也称为垂直思维)。然而,横向思维(Lateral Thinking)是从侧面的角度(也称为水平思维)看待事物,以便找到不是立即显而易见的答案。该术语于 1967.

什么是萨伊尔定律?

1343

萨伊尔定律(又名塞尔定律:Sayre's Law):在任何争端中,感情的强度与所涉及的问题的价值成反比。这个概念解释了乌合之众为何总是会关注错误的事情。与家人一起在城里度假,您可能会发现讨论有时会转向.

ChatGPT将彻底改变医疗保健流程 - Manidis

915 2K

当前人们正在将生成式人工智能应用于医疗服务,但是却犯了一个巨大的错误 :GPT3不会取代你的医生,而它将改变医疗保健的运行方式。医疗保健领域的技术存在巨大的信任问题: 技术的每一次“代际转移”都导致了.

什么是 PageRank 算法?

966 2K

谷歌创始人拉里佩奇和谢尔盖布林需要一种算法来对页面进行排名并为用户提供最佳搜索结果:PageRank算法。使用 PageRank 算法,每个页面都会根据链接到它的其他页面的数量和重要性获得排名。页面排.

什么是溢出效应?

4782

溢出效应(Spillover Effect)溢出效应是指在看似不相关的情况下,由于某件事情而引起的事件。(吸烟的影响波及到周围的人,买车的影响增加了道路的拥堵,大声的音乐让你的邻居睡不着觉,等等)。溢.

什么是稀缺性?

2773

稀缺性(Scarcity)是Cialdini的原则之一,也是一个影响模型,描述了你如何对机会越少越感兴趣,从而引发你对错过的恐惧。稀缺性信号往往意味着社会证明。稀缺性是一个经济学概念,植根于生活中最基.

使用 PyMC 进行简单的欺诈检测

1443 5K

使用PyMC 和贝叶斯统计作为机器学习的替代方案。在我最近的一个项目中,我们面临着数据非常有限的预测问题。每组数据都需要花费专家数小时来编制,结果并不总是成功的。因此,我们正在寻找一种工具来满足这些要.

将数据整合到您的下一个产品中 - Luke Lin

738

在不久的将来,越来越多的产品将开始将数据直接集成到最终用户体验中。我们将通过个性化系统、应用机器学习或直接向最终用户显示聚合数据来看到这一点。因此,产品和工程团队需要将数据的细微差别融入到他们构建产品.

什么是不确认偏见?

982

不确认偏见,也称为失证偏差或认知失调(Disconfirmation Bias):不加批判地只接受那些支持自己信念的证据与信息,而积极地反驳那些挑战自己信念的其他证据。当证据或外部信息使我们高兴时就不.

数据库视图的用处 - Reddit

922

数据库视图只是伪装成表的查询。数据表主要记录数据。视图产生从该数据派生的信息。下面是几个用途:1、抽象也许您必须连接来自数十个不同表的数据才能获得特定类型报告所需的所有数据。因此,您可以通过创建一个将.