Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
数据科学教程
学习Hadoop最佳书籍推荐
Apache Hadoop是一项杰出的技术,它推动了当前的 IT 行业。许多高端数据处理框架,如 Amazon S3、Apache Spark、Databricks 都是建立在 Hadoop 之上的。学习 Hadoop 是软件工程师的首要任务之一,没有比书更适合学习的地方了。因此,我向您
为什么领英让人扼腕叹息? - trungphan
作为全球最大招聘社区领英LinkedIn,如今却成为网络上模因笑梗的素材。是什么基因导致了今天令人叹息cringe的局面?为了回答这个问题,我读了一堆论坛、文章和LinkedIn工程博客的伟大见解。我认为是由3个因素造成的。 个性:LinkedIn要求你成为什么样的人
图灵奖获得者:数据科学家或将取代业务分析师?
商业智能BI会给你一张大数字表格;数据科学家会给你一个预测模型那么,如果你是这家公司的首席执行官,你宁愿拥有哪一个?你更愿意拥有预测模型。因此,在未来十年或二十年内将发生的事情是,数据科学家将取代商业分析师,成为研究零售数据的人。此外,数据科学家还将做所有这些其他的事情。因此
大数据分析为什么大多数会失败?(2)
东南亚最大消费app的商业智能副总裁的BI经验证明:没有业务领域深入挖掘,就得不到大数据分析带来的业绩提升,只会导致大数据杀熟敲诈。上篇点击标题,本文是续篇,有关领域事件的详细设计,没有良好的DDD设计,就没有良好的大数据结果,就没有良好的数据工程,这也是大多数数据分析都是失败的原因
应该考虑实施 DataOps 的 5 个理由
自2015 年DataOps 术语出现以来,受到了数据科学家、分析师和数据经理以及从事数据使用和数据价值工作的人员的欢迎。通过将敏捷方法应用于数据处理管道来驱动数据价值,是 DataOps 方法的主要目标。在本文中,我将解释 DataOps 究竟是什么、DevOps 和 DataOp
如何实现实时机器学习? - huyenchip
有两个级别的实时机器学习。 级别1:您的 ML 系统进行实时预测(批量预测)。 级别2:您的系统可以合并新数据并实时更新您的模型(实时学习)。 阶段 1. 批量预测所有的
五十种大数据分析工具和软件
数据也以不同的格式存在,如结构化数据、半结构化数据和非结构化数据。大数据分析是一个用于提取有意义的见解的过程,例如隐藏的模式、未知的相关性、市场趋势和客户偏好。大数据分析提供了各种优势——它可以用于更好的决策、防止欺诈活动等等。数据在转化为有助于管理层决策的有用信息和知识之前是没有意
揭秘Stripe欺诈检测系统背后的机器学习算法 - quastor
Stripe 是世界上最大的支付处理商之一。该公司的主要产品是 Stripe Payments API,开发人员可以使用它轻松地将支付功能嵌入到他们的应用程序中。由于 Stripe 的规模,它们是支付欺诈和网络犯罪的一大目标。Andrew Tausz 是 Stripe
Airbnb定制Superset实现更好BI商业智能
Apache Superset 被Airbnb等企业使用,使用 Kubernetes 作为 Superset 的 PaaS,每天为 600 多名活跃用户提供查看超过 10 万张图表的服务。 使用云原生CloudNative架构Web 服务器(Gunicorn、Nginx、Ap
了解数据分析项目生命周期
在处理数据分析项目时,应该遵循一些固定的任务来获得预期的输出。所以在这里我们将构建一个数据分析项目周期,这将是一组标准的数据驱动流程,以有效地将数据引导到洞察力。项目生命周期的定义数据分析过程应遵循使用输入数据集有效实现目标的序列。该数据分析过程可能包括识别数据分析问题、设计和收集数据集、数
2022年值得关注的5个AI趋势 – thenewstack
COVID-19 大流行加速了 2021 年人工智能或机器学习的采用。企业对自动化的需求以及人工智能硬件和软件的进步正在将应用人工智能变为现实。 以下是 2022 年的五种人工智能趋势:趋势 1:大型语言模型 (LLM) 定
改变数字分析生态系统的10个大数据公司
以颠覆性解决方案彻底改变数字生态系统的 10 大大数据公司: A3logics - 重点领域:大数据、IT 咨询、SaaS 开发服务行业:房地产与住房 IT、教育与电子学习、航运与物流、零售与电子商务、旅游与休闲、银行与金融、食品与餐厅、石油与燃气、媒体和娱乐
数据湖 vs 数据仓库 vs 数据库
对于外行来说,数据存储通常在传统数据库中处理。但是对于大数据,公司使用数据仓库和数据湖。 什么是数据库?数据库是存储结构化数据的存储位置。我们通常会想到计算机上的数据库——保存数据,可以通过多种方式轻松访问。可以说,您可以将智能手机本
ShifuML/shifu: Hadoop上的机器学习和数据挖掘框架
来自Paypal的Shifu是一个建立在 Hadoop 之上的开源、端到端的机器学习和数据挖掘框架。Shifu 专为数据科学家设计,简化了构建机器学习模型的生命周期。虽然最初是为欺诈建模而构建的,但 Shifu 已推广到许多其他建模领域。Shifu 的优点之一是机器学习中的端到端建模
Qihoo360/XLearning:奇虎的基于Hadoop 人工智能项目
XLearning是一个结合大数据和人工智能的便捷高效的调度平台,支持多种机器学习、深度学习框架。XLearning 在 Hadoop Yarn 上运行,并集成了 TensorFlow、MXNet、Caffe、Theano、PyTorch、Keras、XGBoost 等深度学习框架。XLea
业界使用的两种主要机器学习技术 -svpino
当今业界使用的两种主要机器学习技术: 1. 梯度提升树 2. 深度学习 将时间集中在学习 Scikit-Learn、XGBoost 和 Keras 或 PyTorch 等深度学习库,您将充分利用您的时间.如果需要处理结构化数据:Scikit-Lear
Google AI:人类皮层的可浏览千万亿级重建
连接组是生物体大脑中所有神经连接的地图,它有助于理解大脑内神经相互作用的组织。 发布大脑中所有神经元和突触的完整映射非常复杂,2020 年 1 月,谷歌研究院发布了果蝇的“半脑”
ML 中的并行编程知识有多大用处?- reddit
在 AI/ML 世界中并行计算的知识有多大用处或适用性?AI/ML世界中有模型并行和数据并行,当你使用 Tensorflow 或 PyTorch 时,你就会知道它们背后的场景。因此,在实现自己的数据加载器或模型训练器时,您可能会编写更好的代码。如果您主要使用预先训练的模型,或
上页
下页
关闭