MLOps

     

Lyft 市场中流媒体管道的演变

775

Lyft 撰写了有关其基于 Apache Beam 的流式管道架构的演变。该博客讲述了初始版本是如何从 cron 作业开始的,以及为简化管道创建而进行的持续改进。背景2017 年,我们 Marketp.

RecSysOps:奈飞运维大型推荐系统的最佳实践

1033 3K

Netflix 撰写了一篇激动人心的博客,讲述了在生产环境中操作推荐引擎的最佳实践。运营一个大规模的推荐系统是一项复杂的工作:它需要高可用性和吞吐量,涉及许多服务和团队,推荐系统的环境每秒都在变化。例.

Snap:如何加速推荐系统的特征工程

890

开发人员提高特征工程的速度是许多公司快速迭代和构建 ML 应用程序的重点。沿着Airbnb 的 Zipline和 Uber 的Michelangelo Palette的路线,Snap 撰写了关于其内部.

Numaproj :基于Kubernete 的实时分析AIOps

1219 1

根据麦肯锡公司最近一项关于开发人员速度的研究,数字优先企业的业务绩效的首要驱动因素是对一流开发平台的投资。在过去四年中,Intuit 对 Kubernetes 和Argo等云原生技术的投资以在全公司范.

mlflow + airflow + kserve的MLOps设置案例

1182 1

此存储库包含一个完全可部署的环境,用于使用 Apache Airflow、MLFlow 和 KServe 执行 MLOps。我们假设您具有以下条件: 访问具有至少 4 个 CPU 内核和 20Gb 的.

机器学习与传统软件开发的冲突与融合 - alepiad

1098

在过去的几年里,我一直在用机器学习和数据科学的想法来颠覆传统的软件公司,这些想法直接来自我团队的核心研究。我发现大多数问题来自三个关键领域。大部分障碍可以归为以下三类之一: 语言 开发过程 预期结果 .

罗列50多种开源MLOps工具测试结果的网站

1143

过去几周我研究了最流行的开源 MLOps 工具,我想与您分享结果。我创建了一个网站 ( https://mymlops.com/ ),列出了这些工具,解释了何时使用它们以及需要注意的陷阱。您可以根据我.

数据科学中特征工程如何自动化? - Reddit

644

我目前是一名数据科学家,我发现我的大部分时间都花在了特征工程上。我的一般做法是,我创建数据的聚合(通过sql,因为需要处理的数据量很大),如sum,mean,avg,std,median,q25,q7.

MLOps是过度工程吗?- Reddit

676

数据工程比 DS数据科学 更受欢迎。不幸的是,ML(过度)工程是造成这种情况的一个原因。以前可以使用 crontab 和 15 行 shell 自动化模型;而现在,你需要在你的 XGBoost 模型后.

2022年值得关注的5个AI趋势 – thenewstack

1549 4K

COVID-19 大流行加速了 2021 年人工智能或机器学习的采用。企业对自动化的需求以及人工智能硬件和软件的进步正在将应用人工智能变为现实。以下是 2022 年的五种人工智能趋势:趋势 1:大型语.

机器学习工程师会喜欢的5个Kubeflow 1.3新功能 - thenewstack

1759 2K

Google 的Kubeflow 1.3是最流行的 Kubernetes 开源机器学习平台的最新版本。它具有许多新功能和增强功能,使机器学习操作 ( MLOps ) 变得简单易用。Kubeflow 1.

当前机器学习失败危机呼唤MLOps - gradientflow

780 2K

根据2020 年 Gartner 人工智能炒作周期,机器学习 (ML) 正在进入幻灭低谷阶段,不过这才是AI真正工作开始的阶段:正在开发最佳实践、基础设施和工具,以促进技术集成到现实世界的生产环境中。.

Feature Store将成为机器学习与数据工程的基础架构 - KDnuggets

4286 4K
在这篇评论中,描述了当前的Feature Store格局,以及如何在MLOps管道中构建?人工智能和机器学习已达到拐点。在2020年,各种规模的不同行业的组织开始将其ML项目从实验发展到工业规模的生产.

如何使用MLOps将机器学习自动推向生产环境? - kdnuggets

2019
由于MLOps是一个新生领域,因此可能很难掌握其含义和要求。实施MLOps的最大挑战之一是在ML管道上叠加DevOps实践的难度。这主要是由于根本差异:DevOps处理的是代码,而ML是既是代码又有数.