Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
中台数据工程教程
流行的大数据流管道实际就是传统数据库的物化视图 - nchammas
本文讨论将数据湖概念化
使用PostgreSQL作为数据仓库 - narrator
在人工智能公司Narrator支持许多数据仓库,包括Postgres。尽管它是为生产系统而设计的,但稍作调整后,Postgres可以非常好地用作数据仓库。 总结:
国外各大互联网巨头的推荐算法和系统设计 - theinsaneapp
本文个人研究。有些内容可能并非100%准确,但我已尽力保持其准确性,信息量和价值。 1. Uber系统设计
时序数据库QuestDB是如何实现每秒140万行的写入速度?
QuestDB是一个快速开源时间序列数据库,QuestDB是一个用于时间序列,事件和分析工作负载的开源数据库,主要关注性能(https://github.com/questdb/questdb)。<
Feature Store将成为机器学习与数据工程的基础架构 - KDnuggets
在这篇评论中,描述了当前的Feature Store格局,以及如何在MLOps管道中构建?人工智能和机器学习已达到拐点。在2020年,各种规模的不同行业的组织开始将其ML项目从实验发展到工业规模的生产。这样做的时候,他们意识到他们在功能特征定义和提取上浪费了很多时间和精力。F
Apache Superset是一款可视化探索大数据的开源新工具 - thenewstack
Apache Superset使用户可以使用无代码可视化构建器和SQL编辑器来浏览数据并构建可视化。它与
现代数据基础架构的新兴架构
现在,我们开始看到围绕数据构建的大型,复杂系统的兴起-系统的主要商业价值来自于数据分析,而不是直接来自软件。我们看到这一趋势在整个行业中产生的快速影响,包括新角色的出现,客户支出的变化以及提供围绕数据的基础架构和工具的新创业公司的出现。我们请专家整理一套通用的“蓝图”,这是基于规模,
数据基础架构中的新技术方法:惠普HPE Ezmeral数据结构
一项新的技术论文“ HPE Ezmeral数据结构:用于数据存储和管理的现代基础结构”探讨了统一数据基础结构Data Fabric的选择
如何在区块链dApp上存储数据 - Oliver
dApp程序员的权衡:将哪些数据放在链上,链上的更多数据会增加成本,数据过多可能会使您的应用无法使用。存储较少的数据可能也不是一种选择。如果使用专用数据库这种方法将使dApp成为应用程序。如果引入中央数据存储,则可以规避某些区块链的限制,但是并不能保证实现去中心化。可以将链上
如何使用MLOps将机器学习自动推向生产环境? - kdnuggets
由于MLOps是一个新生领域,因此可能很难掌握其含义和要求。实施MLOps的最大挑战之一是在ML管道上叠加DevOps实践的难度。这主要是由于根本差异:DevOps处理的是代码,而ML是既是代码又有数据。当涉及到数据时,不可预测性始终是一个主要问题。由于代码和数据是独立且并行发展的,
我在2020年作为数据科学家学习的8种新工具 - kdnuggets
尽管2020年是充满挑战的一年,但我能够使用到远程工作的过渡来探索新工具来扩展我的数据科学技能。这一年,我从数据科学家过渡到应用科学家,不仅负责数据产品的原型制作,还将这些系统投入生产并监控系统的运行状况。我曾经使用过Docker等工具来对应用程序进行容器化,但是我没有将容器部署为可
机器学习MLOps学习路径 - AI_Grigor
学习掌握MLOps的途径: Linux Python Docker AWS Terraform Kubernetes Prometheus Grafana Kubeflow CI/CD
将机器学习投入生产的云服务SageMaker - svpino
准备将您的机器学习模型投入生产吗?亚马逊提供SageMaker:这是一种完全托管的机器学习服务,可以一站式提供您所需的一切。服务列表令人印象深刻: 1. Studio 2. Projects 3. Studio Notebooks 4. Exp
优步如何分析利用它们的大数据?
Uber通过推动数十亿次打车数据,为数百万的司机,企业,餐馆和快递员提供动力,从而彻底改变了世界的生活方式。这个庞大的运输平台的核心是大数据和数据科学,可为Uber所做的一切提供支持,例如更好的定价和匹配,欺诈检测,降低ETA以及试验。每天收集和处理PB级的数据,成千上万的用户获得洞察力,并
数据分析师和数据科学家有什么区别? - XaviGrowth
这是数据世界中最常见的问题之一。要了解差异,让我们看一下每个职位所需的技能: 数据分析师需要: 具有统计基础知识 进行数据挖掘(在原始数据中查找值) 知道如何在Python / R,SAS,SQL甚至Excel中操作数据。同时...
Redis全方位作用总结 -Vedcraft
Redis作为开源内存数据存储不仅限于缓存,还是数据库、事件存储、消息代理、内存数据存储、AI功能存储、AI和搜索解决方案,使我们能够构建超低延迟和高吞吐量的实时应用程序。本文总结了Ofer Bengal(Redis Labs联合创始人兼首席执行官)和Yiftach Shoolman
号称不需要Paxos的分布式事务解决方案
分布式应用程序在主机之间使用复制方法,由Paxos等协议实现,这样就确保数据可用性并透明地掩盖服务器故障。本文提出了一种在数据中心内部实现复制的新方法,而无需传统方法的性能成本。我们的工作将复制责任仔细划分为网络层和协议层。网络命令请求,但不确保可靠的交付——使用我们称为有序不可靠多播(OU
数据科学家已死?AutoML使得数据科学更加普及化 - enterpriseai
在过去十年中,“数据科学家”一直是最受欢迎的职位之一。但是再过十年,由于诸如自动机器学习或AutoML之类的技术,该角色将看起来非常不同。新技术已经在帮助减少组织从头开始构建传统数据科学家的生硬AI和ML模型的需求。取而代之的是,在大多数组织中,软件开发人员甚至是非技术人员都将承担繁
上页
下页
关闭