#数据科学

算法是不是灵魂?举办算法大奖赛有用吗?

21-07-07 157 1 banq

这是前Netflix 研究/工程总监对十年前Netflix推荐算法奖的再次声明,原因来自于“开放式算法竞赛有用且有价值吗”的 思考与讨论 。 反对设立这种外部大奖赛的观点认为:公司组织还会认为他们的... 详细

数据科学中最痛苦的方程式:数据 + 假设 = 预测 - Kozyrkov

21-06-07 220 banq

逻辑推理 = 数据 + 假设,(统计)数据并不能给你真相;在统计学中,你所知道的并不是你希望你知道的。 以下是一些标准的误解: “如果我找到正确的方程,我就能知道未知数。” “如果我对我的数... 详细

什么是细分Segmentation? - KDnuggets

21-06-23 184 banq

细分Segmentation是营销中最常用的词之一,但实际上指的是很多东西。   1. 最基本的是,它意味着对对象进行分类 。“对象”通常是人——顾客、购物者、一般消费者——但不一定。例如,我们可以... 详细

通俗易懂讲解贝叶斯论和频率论两者之间的区别?

21-06-07 219 banq

贝叶斯统计推断和频率统计推断之间一直存在争论。频率论者在 20 世纪主导了统计实践。许多常见的机器学习算法(如线性回归和逻辑回归)使用频率论方法来执行统计推断。虽然贝叶斯在 20 世纪之前主导了统计... 详细

快速、慢速两种思考以及相关性与因果性的思考

21-05-25 183 banq

相关性不代表因果关系,但是没有相关肯定没有因果吗?诺贝尔奖获得者卡尼曼也有范常识错误的时候: 《思考,快和慢》 是由诺贝尔经济学奖获得者丹尼尔·卡尼曼(Daniel Kahneman)于20... 详细

企业客服沟通对话信息的开源大数据平台:airy

21-06-10 171 banq

客服与客户之间沟通是每个企业的核心,每家公司都应该拥有自己的对话并以最佳方式利用他们的对话数据,同时考虑到客户的兴趣和隐私。 Airy 是一个对话平台,主要为企业构建:大多数企业都有他们支持的各种对... 详细

6种方式处理机器学习中不平衡的数据集 - svpino

21-07-08 134 banq

让我们从一个例子开始:您正在尝试构建一个分类模型。 1 类:猫 2 类:狗 不幸的是,您的数据非常不准确:有 950 张猫图片和 50 张狗图片。 如果您的模型将每张图片都归类为猫,那么... 详细

幽默:Lemonade机器学习算法可对保险风险预测

21-05-26 120 banq

Lemonade建立在数字载体上:使用机器人和机器学习来使得保险变得即时,无缝和令人愉悦。 这是因为Lemonade处于数据优势上:实际上,Lemonade收集的数据比传统保险公司多100倍: 典型... 详细

数据泄露和数据处理不一致是两个机器学习容易被忽视的错误 - jeande_d

21-06-26 123 banq

机器学习项目的失败可能由多种因素造成,但两个常见的被忽视的错误做法是数据泄漏和数据处理不一致。这里有3种方法可以避免它们: 1. 做探索性数据分析时不要使用测试集。只使用训练集。通过不接触测试... 详细

2021 年最佳数据科学工具和软件 - datamation

21-06-21 153 banq

数据科学改变了我们的世界。从大量结构化和非结构化数据中提取洞察力的能力已经彻底改变了许多领域——从营销和医学到农业和天文学。数据科学借鉴数学、统计学、计算机科学、信息科学等领域,利用数学公式和算法将... 详细

Orchest是用于数据科学的基于浏览器的IDE

21-05-27 163 banq

Orchest是一种新型的数据科学IDE,它开箱即用地集成了您最喜欢的数据科学工具,因此您不必这样做。该应用程序易于使用,可以在您的笔记本电脑以及大规模云集群上运行。 特点: 可视地构造管道。... 详细

为什么机器学习模型会越来越糟? - Santiago

21-05-27 119 banq

当完成了机器学习模型的构建并且部署了。不幸的是,工作并没有完成。可以说,您只走了一半,机器学习模型的性能会随着时间的推移而降低。 机器学习模型的快速入门: x->y: x:输入数据 y... 详细

Julia:比 Fortran 快,比 Numpy 干净 - matecdev

21-06-21 137 banq

Julia是一种非常新的语言,除其他外,它旨在解决科学计算中所谓的“双语言问题”。 也就是说,我们通常使用快速原型语言(如 Matlab 或 Python)来测试想法,但是当测试完成并且是进行一些严... 详细

四种数据分析的基本方法

21-07-20 95 banq

每天都会产生和存储大量数据。这些数据来自各种形式,或者您每天、每次发布博客甚至在社交网络上发布时都会生成它们。 但数据是什么?数据不是信息,它只是无形的字节流。信息是处理此类数据的结果。从原始数据中... 详细

使用Pandas进行数据清理过程的简单步骤 - sahilfruitwala

21-07-19 96 banq

数据清理是删除、添加或修改数据以进行分析和其他机器学习任务的过程。如果需要数据清理,它总是在任何类型的分析或机器学习任务之前完成。 Clive Humby 说:“数据是新的石油。” 但我们知道数据仍... 详细

共有 791 2 3 4 ... 6 下一页