MLOps

     

2024年数据中台工程十大趋势

85 4K

在当今世界,创新和决策需要实时数据管道和实时数据处理,对数据工程领域的重视程度日益增加。数据工程提供了许多工具和方法,持续为公司提供有关如何克服所面临挑战的见解。什么是数据中台工程?数据中台工程是设计.

学习机器学习与应用机器学习的区别

55

开发新的机器学习技术所需的技能与有效应用机器学习所需的技能几乎没有重叠。有点像芯片设计与软件工程几乎没有重叠。这就是建模者与机器学习工程师之间的区别商业应用通常与研究和理论有很大不同。对于机器学习来说.

MLOps:您需要了解的一切

48 5K

近年来,对数据相关职位的需求不断增长。从不同技术背景转向数据行业的人数比例不断增长。数据科学和分析工作是大多数人梦想的竞争激烈的工作角色。然而,数据行业的其他领域却鲜为人知。这就是机器学习操作 (ML.

SuperDuperDB:一个将 AI 与主流数据库集成的开源框架

570 3K

SuperDuperDB 是一个开源框架,用于将 AI 直接与现有数据库集成,包括流式推理、可扩展模型训练和矢量搜索。SuperDuperDB 不是数据库。它将您最喜爱的数据库转变为人工智能开发和部署.

大语言模型LLM的涌现架构

899 6K

预训练的人工智能模型代表了自互联网以来最重要的软件架构变化。它们使个人开发人员能够在几天内构建出令人难以置信的人工智能应用程序,超越大型团队需要数月才能构建的监督机器学习项目。我们在这里列出的工具和模.

MLOps 主要是数据工程 - cpard

475 4K

MLOps 作为管理数据基础设施的一类新工具出现,专门针对 ML 用例,主要假设是 ML 具有独特的需求。几年后,随着炒作消失,很明显,MLOps 与数据工程的重叠比大多数人认为的要多。让我们看看为什.

机器学习的静态特征和动态特征

1994
在设计机器学习系统时,了解静态和动态特征之间的区别很重要,因为它可能会成败您将 ML 模型发布到生产中的努力。 静态特征: 这些特征是由不经常变化的数据产生的。 这些数据很可能与你的数据模型中的维度相.

Lyft 市场中流媒体管道的演变

762

Lyft 撰写了有关其基于 Apache Beam 的流式管道架构的演变。该博客讲述了初始版本是如何从 cron 作业开始的,以及为简化管道创建而进行的持续改进。背景2017 年,我们 Marketp.

RecSysOps:奈飞运维大型推荐系统的最佳实践

1015 3K

Netflix 撰写了一篇激动人心的博客,讲述了在生产环境中操作推荐引擎的最佳实践。运营一个大规模的推荐系统是一项复杂的工作:它需要高可用性和吞吐量,涉及许多服务和团队,推荐系统的环境每秒都在变化。例.

Snap:如何加速推荐系统的特征工程

883

开发人员提高特征工程的速度是许多公司快速迭代和构建 ML 应用程序的重点。沿着Airbnb 的 Zipline和 Uber 的Michelangelo Palette的路线,Snap 撰写了关于其内部.

Numaproj :基于Kubernete 的实时分析AIOps

1216 1

根据麦肯锡公司最近一项关于开发人员速度的研究,数字优先企业的业务绩效的首要驱动因素是对一流开发平台的投资。在过去四年中,Intuit 对 Kubernetes 和Argo等云原生技术的投资以在全公司范.

mlflow + airflow + kserve的MLOps设置案例

1171 1

此存储库包含一个完全可部署的环境,用于使用 Apache Airflow、MLFlow 和 KServe 执行 MLOps。我们假设您具有以下条件: 访问具有至少 4 个 CPU 内核和 20Gb 的.

机器学习与传统软件开发的冲突与融合 - alepiad

1095

在过去的几年里,我一直在用机器学习和数据科学的想法来颠覆传统的软件公司,这些想法直接来自我团队的核心研究。我发现大多数问题来自三个关键领域。大部分障碍可以归为以下三类之一: 语言 开发过程 预期结果 .

罗列50多种开源MLOps工具测试结果的网站

1133

过去几周我研究了最流行的开源 MLOps 工具,我想与您分享结果。我创建了一个网站 ( https://mymlops.com/ ),列出了这些工具,解释了何时使用它们以及需要注意的陷阱。您可以根据我.

数据科学中特征工程如何自动化? - Reddit

637

我目前是一名数据科学家,我发现我的大部分时间都花在了特征工程上。我的一般做法是,我创建数据的聚合(通过sql,因为需要处理的数据量很大),如sum,mean,avg,std,median,q25,q7.

MLOps是过度工程吗?- Reddit

670

数据工程比 DS数据科学 更受欢迎。不幸的是,ML(过度)工程是造成这种情况的一个原因。以前可以使用 crontab 和 15 行 shell 自动化模型;而现在,你需要在你的 XGBoost 模型后.

2022年值得关注的5个AI趋势 – thenewstack

1540 4K

COVID-19 大流行加速了 2021 年人工智能或机器学习的采用。企业对自动化的需求以及人工智能硬件和软件的进步正在将应用人工智能变为现实。以下是 2022 年的五种人工智能趋势:趋势 1:大型语.

机器学习工程师会喜欢的5个Kubeflow 1.3新功能 - thenewstack

1752 2K

Google 的Kubeflow 1.3是最流行的 Kubernetes 开源机器学习平台的最新版本。它具有许多新功能和增强功能,使机器学习操作 ( MLOps ) 变得简单易用。Kubeflow 1.

当前机器学习失败危机呼唤MLOps - gradientflow

775 2K

根据2020 年 Gartner 人工智能炒作周期,机器学习 (ML) 正在进入幻灭低谷阶段,不过这才是AI真正工作开始的阶段:正在开发最佳实践、基础设施和工具,以促进技术集成到现实世界的生产环境中。.

Feature Store将成为机器学习与数据工程的基础架构 - KDnuggets

4278 4K
在这篇评论中,描述了当前的Feature Store格局,以及如何在MLOps管道中构建?人工智能和机器学习已达到拐点。在2020年,各种规模的不同行业的组织开始将其ML项目从实验发展到工业规模的生产.

如何使用MLOps将机器学习自动推向生产环境? - kdnuggets

2012
由于MLOps是一个新生领域,因此可能很难掌握其含义和要求。实施MLOps的最大挑战之一是在ML管道上叠加DevOps实践的难度。这主要是由于根本差异:DevOps处理的是代码,而ML是既是代码又有数.