Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
数据科学教程
认知谬论:什么是特威曼定律?
特威曼定律也称为Twyman定律:数据越引人注目(显性突出),错误的可能性就越大。这是因为错误的实验或者采集远比这种引人注目的突出结果更为常见,发生的概率更多 ;反之,数据越枯燥,越值得信赖。
吴恩达:以数据为中心的人工智能?
吴恩达在 2000 年代后期,率先使用图形处理单元 (GPU) 与斯坦福大学的学生一起训练深度学习模型,并于 2011 年共同创立了Google Brain ,然后在百度担任了三年的首席科学家,在那里他帮助建立了中国科技巨头的人工智能集团。因此,当他说他已经确定了人工智能的下一个重大转变时,
五十种大数据分析工具和软件
数据也以不同的格式存在,如结构化数据、半结构化数据和非结构化数据。大数据分析是一个用于提取有意义的见解的过程,例如隐藏的模式、未知的相关性、市场趋势和客户偏好。大数据分析提供了各种优势——它可以用于更好的决策、防止欺诈活动等等。数据在转化为有助于管理层决策的有用信息和知识之前是没有意
什么是认知谬论中的“相对困境”?
所有问题都是相对的,相对困境(Relative Privation或称为相对贫困)是一个非常普遍的认知谬论,通过陈述一个更重要的问题的存在来拒绝一个论点,人们因为其他事情更糟糕而忽略了当前问题,因为存在一个更糟糕的问题,从而使最初的论点变得无关紧要。假设你的朋友做晚餐。吃完饭,他会征
为什么领英让人扼腕叹息? - trungphan
作为全球最大招聘社区领英LinkedIn,如今却成为网络上模因笑梗的素材。是什么基因导致了今天令人叹息cringe的局面?为了回答这个问题,我读了一堆论坛、文章和LinkedIn工程博客的伟大见解。我认为是由3个因素造成的。 个性:LinkedIn要求你成为什么样的人
认知谬论:什么是维度诅咒
你的数据越详细,它就越缺乏洞察力。仅向图形添加 1 个额外参数会导致图形的体积呈指数增长,分散包含的数据点并删除它们之间的有意义的关联。维度诅咒现象出现在数值分析、采样、组合学、机器学习、数据挖掘和数据库等领域。这些问题的共同主题是,当维度增加时,体积空间的增长如此之快,以至于可用数
大数据分析为什么大多数会失败?(2)
东南亚最大消费app的商业智能副总裁的BI经验证明:没有业务领域深入挖掘,就得不到大数据分析带来的业绩提升,只会导致大数据杀熟敲诈。上篇点击标题,本文是续篇,有关领域事件的详细设计,没有良好的DDD设计,就没有良好的大数据结果,就没有良好的数据工程,这也是大多数数据分析都是失败的原因
图灵奖获得者:数据科学家或将取代业务分析师?
商业智能BI会给你一张大数字表格;数据科学家会给你一个预测模型那么,如果你是这家公司的首席执行官,你宁愿拥有哪一个?你更愿意拥有预测模型。因此,在未来十年或二十年内将发生的事情是,数据科学家将取代商业分析师,成为研究零售数据的人。此外,数据科学家还将做所有这些其他的事情。因此
揭秘Stripe欺诈检测系统背后的机器学习算法 - quastor
Stripe 是世界上最大的支付处理商之一。该公司的主要产品是 Stripe Payments API,开发人员可以使用它轻松地将支付功能嵌入到他们的应用程序中。由于 Stripe 的规模,它们是支付欺诈和网络犯罪的一大目标。Andrew Tausz 是 Stripe
认知谬论:一句话解释什么是社交证明(Social Proof)
当不确定如何行动时,人们会模仿他人,向外寻找证据来帮助他们的决策。当西尔凡-戈德曼发明购物手推车时,人们不愿意使用它们,因为它们看起来很傻。于是戈德曼付钱给演员,让他们在他的商店里使用手推车,大家很快就效仿。类似中国成语:群起效尤,但没有褒贬的意思,客观描述一种现象,网络直播
Airbnb定制Superset实现更好BI商业智能
Apache Superset 被Airbnb等企业使用,使用 Kubernetes 作为 Superset 的 PaaS,每天为 600 多名活跃用户提供查看超过 10 万张图表的服务。 使用云原生CloudNative架构Web 服务器(Gunicorn、Nginx、Ap
数据科学工作需要的十大职业技能列表
认知谬论:什么是吉布森定律?
在公共关系和法律实践中,吉布森定律认为“每个博士都对应一个相同但是观点相反的博士”。该术语专门指在对抗性司法制度下的审判中,由对方传唤的专家证人证词之间的冲突。正反双方都能找到支持自己的专家,在法律和政策方面,任何人都可以找到支持他们观点的主题专家,因为拥有博士学位并不一定能使某人正确,它通常只会使
认知谬论:什么是弗雷德金悖论
弗雷德金悖论:两个选择看起来越相似,决定就越不重要,但在它们之间做出选择就越困难。因此,我们经常在最不重要的决定上花费最多的时间。涉及两个选项之间的差异与它们之间的选择决策难度之间层负相关,这个悖论对纯工具理性的可能性构成了重大挑战。有没有注意到你花了整整
数据湖 vs 数据仓库 vs 数据库
对于外行来说,数据存储通常在传统数据库中处理。但是对于大数据,公司使用数据仓库和数据湖。 什么是数据库?数据库是存储结构化数据的存储位置。我们通常会想到计算机上的数据库——保存数据,可以通过多种方式轻松访问。可以说,您可以将智能手机本
ShifuML/shifu: Hadoop上的机器学习和数据挖掘框架
来自Paypal的Shifu是一个建立在 Hadoop 之上的开源、端到端的机器学习和数据挖掘框架。Shifu 专为数据科学家设计,简化了构建机器学习模型的生命周期。虽然最初是为欺诈建模而构建的,但 Shifu 已推广到许多其他建模领域。Shifu 的优点之一是机器学习中的端到端建模
Google AI:人类皮层的可浏览千万亿级重建
连接组是生物体大脑中所有神经连接的地图,它有助于理解大脑内神经相互作用的组织。 发布大脑中所有神经元和突触的完整映射非常复杂,2020 年 1 月,谷歌研究院发布了果蝇的“半脑”
ML 中的并行编程知识有多大用处?- reddit
在 AI/ML 世界中并行计算的知识有多大用处或适用性?AI/ML世界中有模型并行和数据并行,当你使用 Tensorflow 或 PyTorch 时,你就会知道它们背后的场景。因此,在实现自己的数据加载器或模型训练器时,您可能会编写更好的代码。如果您主要使用预先训练的模型,或
上页
下页