数据分析指南

     

直觉和分析思维不同之处

281 1 3K

下面是一道相对简单的数学题:一根球棒和一个球的总价是 1.10 美元。球棒比球贵 1 美元。球的价格是多少?(我会在下面给出答案)。丹尼尔-卡尼曼(Daniel Kahneman)在《思考,快与慢》(.

量化方法是将数学洞察力与交易本能结合

203 1

对于寻求深化策略的交易者: 变得更加量化可以在经常不确定的市场世界中提供清晰度。让我们来探讨如何将这种观点嵌入到你的交易方法中。 教育第一:开始深入研究基本的统计模型和概率理论。 这些为理解市场趋势和.

腾讯使用大语言模型增强基于Doris的OLAP服务

338 1

腾讯利用大型语言模型 (LLM) 增强基于 Apache Doris 的 OLAP 服务腾讯采用大型语言模型 (LLM) 来增强其基于 Apache Doris 的 OLAP 服务。LLM作为将自然语.

人类如何区分幻觉与现实?

247 1

1910年,心理学家玛丽·切维斯的一项研究发现,当我们对某事物的感知与我们所想象的相匹配时,我们就会认为它是想象的。这在心理学中被称为“自信效应”。观察结果表明,我们脑海中的图像和世界上真实感知的图像.

如何辨别循证医学研究的好坏?

219 2K

循证医学科学研究遵循研究从想法到设计再到执行的过程。(banq:中医是依据经验;西医是基于证据,主要取决于你相信经验还是证据?属于信念、信仰领域。信仰是一个人进入任何上下文场景的假设前提,你信中医,当.

讨厌 Google Analytics 4的10件事

356 3K

Google Analytics 4 并没有在营销人员中取得良好的开端。通过问卷调查,下面列出了最常见的投诉:1.用户界面GA4 的用户界面是读者反映的最大问题。用户界面被描述为 "缓慢"、"可笑 ".

七月大科技工程文摘

488 5K

本文摘包含Airbnb优化数据访问、Etsy 实时广告个性化、Pinterest 时间序列数据工作、Wix 大迁移等!1、[Airbnb] Riverbed:以 Airbnb 的规模优化数据访问 概述.

分子生物学中的大语言模型

519 8K

分子生物学的中心法则描绘了从基因组到基因表达和随后的蛋白质生产的分子信息流,蛋白质是生命的基本组成部分。基因组中有大约20,000个基因,这些基因是负责蛋白质合成的DNA片段。大约1%的基因组编码蛋白.

OpenAI向ChatGPT Plus用户推出Code Interpreter

511

这是OpenAI自GPT-4以来发布的最强大的功能。让每个人都成为数据分析师 以下是Code Interpreter的15个令人兴奋的用例:1、在几秒钟内细分您的客户需要一个电子表格,然后自行得出音乐.

产品经理如何了解客户的“待完成工作”

426 9K

创新本质上是一种失败又失败的努力吗?如果您了解客户做出他们所做选择的原因,则不会。从我们有记忆以来,创新一直是领导者的首要任务,也是他们的首要挫折。在最近的一次麦肯锡民意调查中,84%的全球高管报告说.

五个产品数据的可持续检测分析步骤

509 2K

以下 5 个步骤整合到您的工作流程中,以开始使用更好的分析工具:第0步:用数据赋予你的工程师权力。有一个关键的第0步,没有这一步,无论你的整体流程有多好,你的检测都不会达到标准。拥有最佳检测实践的产品.

MotherDuck:大数据已死

752 5K

十多年来,人们很难从他们的数据中获得可操作的洞察力,这一事实被归咎于其规模。诊断结果是 "你的数据对你那微不足道的系统来说太大了",而治疗方法是购买一些能够处理大规模的新的花哨的技术。当然,在大数据工.

数据中台的数据建模

1019 6K

我们探讨了数据建模在数据工程中的重要性、数据建模的历史以及数据日益复杂的情况。我们还谈到了理解数据格局的重要性、其挑战以及业务需求在推动成功的数据项目中的关键作用。坚实的数据建模基础可帮助组织创建高效.

什么是聚类错觉?

1015

聚类错觉(Clustering Illusion)是指行为金融学中的一种认知偏差,在这种偏差中,投资者观察到的模式实际上是随机事件。换句话说,聚类错觉偏差是由于看到随机事件的趋势而产生的偏差,这些随机.

引发硅谷银行倒闭的蝴蝶效应

665 2K

这场灾难有可能是由Byrne Hobart的时事通讯自媒体引起的蝴蝶效应: 1)Byrne Hobart发表一篇文章/推特,揭露硅谷银行SVB的风险。 2)几乎所有VC都会阅读这篇通讯 3) 他们都开.

什么是破窗理论?

2521

破窗理论(Broken Windows Theory):在一个特定的环境中,如果有一个问题不被重视都会影响人们对这个环境的态度,并导致更多的问题。例如:城市花坛里如果有人第一个吐痰或扔了垃圾,那么就会.

使用机器学习进行预测

729 2K

时间序列预测是机器学习历史最悠久的应用之一,也是整个行业使用最普遍的技术之一(如果不是最普遍的话)。然而,在最近的 ML 热潮中,预测有些落伍了。时间序列预测正在成为一门失传的艺术。 它是美国零售业5.

什么是横向思维?

2039

通常,逻辑思维用于直接、直接地解决问题(也称为垂直思维)。然而,横向思维(Lateral Thinking)是从侧面的角度(也称为水平思维)看待事物,以便找到不是立即显而易见的答案。该术语于 1967.

什么是萨伊尔定律?

1354

萨伊尔定律(又名塞尔定律:Sayre's Law):在任何争端中,感情的强度与所涉及的问题的价值成反比。这个概念解释了乌合之众为何总是会关注错误的事情。与家人一起在城里度假,您可能会发现讨论有时会转向.

ChatGPT将彻底改变医疗保健流程 - Manidis

917 2K

当前人们正在将生成式人工智能应用于医疗服务,但是却犯了一个巨大的错误 :GPT3不会取代你的医生,而它将改变医疗保健的运行方式。医疗保健领域的技术存在巨大的信任问题: 技术的每一次“代际转移”都导致了.

什么是 PageRank 算法?

969 2K

谷歌创始人拉里佩奇和谢尔盖布林需要一种算法来对页面进行排名并为用户提供最佳搜索结果:PageRank算法。使用 PageRank 算法,每个页面都会根据链接到它的其他页面的数量和重要性获得排名。页面排.

什么是溢出效应?

4794

溢出效应(Spillover Effect)溢出效应是指在看似不相关的情况下,由于某件事情而引起的事件。(吸烟的影响波及到周围的人,买车的影响增加了道路的拥堵,大声的音乐让你的邻居睡不着觉,等等)。溢.

什么是稀缺性?

2805

稀缺性(Scarcity)是Cialdini的原则之一,也是一个影响模型,描述了你如何对机会越少越感兴趣,从而引发你对错过的恐惧。稀缺性信号往往意味着社会证明。稀缺性是一个经济学概念,植根于生活中最基.

使用 PyMC 进行简单的欺诈检测

1447 5K

使用PyMC 和贝叶斯统计作为机器学习的替代方案。在我最近的一个项目中,我们面临着数据非常有限的预测问题。每组数据都需要花费专家数小时来编制,结果并不总是成功的。因此,我们正在寻找一种工具来满足这些要.

将数据整合到您的下一个产品中 - Luke Lin

739

在不久的将来,越来越多的产品将开始将数据直接集成到最终用户体验中。我们将通过个性化系统、应用机器学习或直接向最终用户显示聚合数据来看到这一点。因此,产品和工程团队需要将数据的细微差别融入到他们构建产品.

什么是不确认偏见?

989

不确认偏见,也称为失证偏差或认知失调(Disconfirmation Bias):不加批判地只接受那些支持自己信念的证据与信息,而积极地反驳那些挑战自己信念的其他证据。当证据或外部信息使我们高兴时就不.

数据库视图的用处 - Reddit

925

数据库视图只是伪装成表的查询。数据表主要记录数据。视图产生从该数据派生的信息。下面是几个用途:1、抽象也许您必须连接来自数十个不同表的数据才能获得特定类型报告所需的所有数据。因此,您可以通过创建一个将.

​​​​​​​相关性并不意味着因果关系

1579 2K

相关性并不意味着因果关系(Correlation Does Not Imply Causation):描述了不能仅仅根据观察到的两个变量之间的关联或相关性来合法地推断它们之间的因果关系。两个事件相继发.

什么是可用性启发式?

2302

可用性启发式(availability heuristic),也称为可用性偏差(Availability Bias),是一种思维捷径:人们会根据一个例子、实例或案例在脑海中出现的容易程度来判断事件的可.

什么是沙特利耶原理?

998

's%20principle沙特利耶原理(Chatelier's Principle)又称为勒沙特利耶法则(Le Chatelier's law)。这是物理学和化学中的一个说法:如果一个系统的平衡被一.