Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
数据科学教程
幽默:微积分可能已经过时 - AlejandroPiad
微积分是高等教育数学的巅峰之作。从幼儿园到大学的整个数学课程都旨在为导数和积分铺平道路。但是,微积分已不再是了解日益由数据驱动的世界的最有用的思维方式。我们需要一门新的数学课程,其重点应放在不确定性条件下进行推理和基于新证据更新我们的信念所需的技能上。这意味着将概率论
通俗讲明白机器学习中的学习问题 - svpino
使用平白语言而不是复杂数学图表公式讲明白监督学习、无监督学习和强化学习、半监督学习、自主学习等关键区别。 监督学习监督学习可能是我们都听说过的最常见的问题类别。我们从示例及其对应标签(或答案)的数据集开始,然后,我们训练一种模:在这些
JupyterLab 3来了请立即升级 - kdnuggets
JupyterLab是“用于Jupyter项目的下一代基于Web的用户界面”,既与Jupyter笔记本计算机兼容又从其升级。Jupyter的基于Web的IDE已经存在了很多年,它们在数据科学界占有举足轻重的地位,加在一起,在相当大的程度上,它们是我们读者中
国外各大互联网巨头的推荐算法和系统设计 - theinsaneapp
本文个人研究。有些内容可能并非100%准确,但我已尽力保持其准确性,信息量和价值。 1. Uber系统设计
lakeFS:实现类似于Git或事件溯源ES的对象存储功能
lakeFS是一个开放源代码层,可为基于对象存储的数据湖提供弹性和可管理性。借助lakeFS,您可以构建可重复的,原子的和版本化的数据湖操作-从复杂的ETL作业到数据科学和分析。lakeFS支持将AWS S3,Azure Blob存储和Google Cloud Storage
现代数据基础架构的新兴架构
现在,我们开始看到围绕数据构建的大型,复杂系统的兴起-系统的主要商业价值来自于数据分析,而不是直接来自软件。我们看到这一趋势在整个行业中产生的快速影响,包括新角色的出现,客户支出的变化以及提供围绕数据的基础架构和工具的新创业公司的出现。我们请专家整理一套通用的“蓝图”,这是基于规模,
机器学习中最重要的突破之一:重用一种模型知识的转移学习 (svpono)
重用一种模型的知识并使其适应不同问题的能力是机器学习中最重要的突破之一:深度学习模型就像一个乐高模块集,将许多模块连接在一起,形成一个长结构。这些模块是机器学习中的层,每一层都有责任。尽管我们不清楚每一层的作用,但我们知道它们与输出越接近,它们就越具体。
如何使用MLOps将机器学习自动推向生产环境? - kdnuggets
由于MLOps是一个新生领域,因此可能很难掌握其含义和要求。实施MLOps的最大挑战之一是在ML管道上叠加DevOps实践的难度。这主要是由于根本差异:DevOps处理的是代码,而ML是既是代码又有数据。当涉及到数据时,不可预测性始终是一个主要问题。由于代码和数据是独立且并行发展的,
建立ML的更好方法:为什么应该使用主动学习 - humanloop
数据标记通常是机器学习的最大瓶颈-查找,管理和标记大量数据以建立性能良好的模型可能需要数周或数月的时间。主动学习使您可以使用少得多的标签数据来训练机器学习模型。最好的人工智能驱动公司,例如
如何摆脱潜意识偏见对业务分析的影响? - modernanalyst
您的业务分析工作中是否存在隐患?无意识的偏见会降低您作为业务分析师的效率吗?无意识的偏见,也称为隐性或隐性偏见,是对一个人或一个群体的无意识偏爱。这种偏见不同于显性偏见,后者是在意识水平上的明显或公然偏见。潜意识的偏见有多种形式,并且可能基于一个人的背景,身体属性甚至一个人的名字。
我在2020年作为数据科学家学习的8种新工具 - kdnuggets
尽管2020年是充满挑战的一年,但我能够使用到远程工作的过渡来探索新工具来扩展我的数据科学技能。这一年,我从数据科学家过渡到应用科学家,不仅负责数据产品的原型制作,还将这些系统投入生产并监控系统的运行状况。我曾经使用过Docker等工具来对应用程序进行容器化,但是我没有将容器部署为可
机器学习MLOps学习路径 - AI_Grigor
学习掌握MLOps的途径: Linux Python Docker AWS Terraform Kubernetes Prometheus Grafana Kubeflow CI/CD
什么时候使用深度学习? - madelinecaples
如果简单的机器学习方法可以令人满意地解决您的问题,则没有太多理由使用神经网络,因为训练它们在时间和计算能力方面往往很昂贵。对于传统的机器学习方法而言,最有效的问题是涉及结构化数据,这些数据即是已经被理解的结构和标签之间的关系。例如,一个数据表将一个人的某些特征(例如年龄,孩子的数量,
电信中的十大数据科学用例 -KDnuggets
随着时间的流逝,数据科学已经证明了其高价值和高效率。数据科学家发现越来越多的新方法在日常生活中实施大数据解决方案。如今,数据已成为成功公司所需的燃料。电信公司也不例外。由于这些情况,他们承受不起不使用数据科学的负担。在电信行业中,数据科学应用程序被广泛用于简化运营,最大化利润,建立有
优步如何分析利用它们的大数据?
Uber通过推动数十亿次打车数据,为数百万的司机,企业,餐馆和快递员提供动力,从而彻底改变了世界的生活方式。这个庞大的运输平台的核心是大数据和数据科学,可为Uber所做的一切提供支持,例如更好的定价和匹配,欺诈检测,降低ETA以及试验。每天收集和处理PB级的数据,成千上万的用户获得洞察力,并
数据分析师和数据科学家有什么区别? - XaviGrowth
这是数据世界中最常见的问题之一。要了解差异,让我们看一下每个职位所需的技能: 数据分析师需要: 具有统计基础知识 进行数据挖掘(在原始数据中查找值) 知道如何在Python / R,SAS,SQL甚至Excel中操作数据。同时...
数据科学家已死?AutoML使得数据科学更加普及化 - enterpriseai
在过去十年中,“数据科学家”一直是最受欢迎的职位之一。但是再过十年,由于诸如自动机器学习或AutoML之类的技术,该角色将看起来非常不同。新技术已经在帮助减少组织从头开始构建传统数据科学家的生硬AI和ML模型的需求。取而代之的是,在大多数组织中,软件开发人员甚至是非技术人员都将承担繁
机器学习操作基本步骤 - svpino
机器学习步骤:分析问题收集数据准备数据选择合适的模型训练模型评估结果寻找biases偏差调整它部署模型监控
上页
下页
关闭