近期国外大科技公司工程文摘

本周Meta 、Netflix 、Doordash 、Booking等发布的最重要、最引人注目的文章!

1. “Meta Llama 3 简介:迄今为止最有能力的公开大模型”

  • 讨论新 8B 和 70B 参数模型的性能
  • 解释模型架构、预训练数据、扩展预训练和指令微调
  • 描述 Llama 3 的大规模部署及其在所有主要平台上的可用性:AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure 等

2. “规模扩大到数十亿”
Canva如何构建可扩展且可靠的内容使用计数服务:

  • 引入使用OLAP数据库的最新架构
  • 涵盖作为计数管道的核心跟踪功能
  • 从 MySQL 开始,回顾架构的演变以及所面临的挑战
  • 介绍将数据迁移到 DynamoDB 并决定不继续
  • 分享使用 OLAP 和 ELT 的简化,以及面临的改进和挑战
  • 分享有关设计可靠服务和引入架构变更的重要经验教训


3、“VES 的制作:用于 Netflix 视频编码的 Cosmos 微服务”

  • Netflix 概述 Cosmos 微服务的三层:API 层(Optimus)、工作流层(Plato) 和计算层(Stratum)
  • 分享经验教训,包括定义适当的服务范围、务实地进行数据建模以及接受服务 API 更改
  • 探索VES的持续发布流程,强调短发布周期和自动化部署

4、《利用大型语言模型构建 DoorDash 的产品知识图谱》

  • 讨论标准化和丰富 DoorDash 零售目录的原始商家数据所面临的挑战
  • 描述如何使用大型语言模型 (LLM) 从非结构化 SKU 数据中提取产品属性
  • 介绍大模型在品牌提取、有机产品标签和广义属性提取中的使用
  • 涵盖属性提取对改善客户购物体验的下游影响
  • 探索未来计划使用多模式大模型进行属性提取,并通过集中式模型平台在 DoorDash 上实现其使用民主化

5、“在 Google Cloud 上采用 Airflow 的经验教训”

  • 描述通过 Composer 产品将工作流程迁移到 GCP 上的 Airflow 的过程
  • 探索创建本地 Airflow 环境来模拟远程生产环境
  • 概述有关 celery.worker_concurrency 和其他参数的性能调整
  • 介绍如何使用 Dataproc 进行繁重的工作并降低成本
  • 共享 DAG 中嵌入式文档的使用以及服务帐户模拟以确保安全

6、“ASOS 的推荐转型”

  • 介绍Transformer技术在时尚推荐系统中的应用
  • 解释Transformer如何利用自我注意力和位置意识来捕捉客户风格和互动:虽然 Transformer 旨在解决自然语言任务,但最近的研究已将其用途扩展到推荐系统。 Transformer 模型使我们能够通过称为自我关注的机制更好地捕捉客户的风格,并使用位置意识推断客户交互随时间的相对重要性。
  • 自注意力使机器学习模型能够构建序列中输入的上下文感知表示。通过在处理时权衡序列中所有其他输入相对于自身的重要性,模型能够对每个输入乃至整个序列建立更丰富的理解。例如,当一双高跟鞋与一套休闲服装和更正式的服装组合时,可以有不同的解释。这种额外的背景使模型能够更好地解释产品并捕捉客户风格的本质。
  • 位置意识使模型能够解释客户过去产品交互的顺序,并根据产品在序列中的位置破译产品的相对重要性,例如,模型可能会更重视昨天购买的产品而不是三个月前查看的产品。当客户的上下文在浏览会话之间切换以及他们的风格随着时间的推移而演变时,这使得该模型能够更好地为客户提供相关建议。
  • 分享使用 Transformers4Rec 库在 ASOS 开发Transformer推荐系统
  • 描述了新 Transformer 模型相对于之前模型的卓越性能,导致评估指标提高了 20%

7、《揭示系统设计中代码级可扩展性的本质》
作者:Keshavpeswani ⸱ Expedia ⸱ 4 分钟阅读 ⸱ 4 月 23 日

  • 代码库的复杂性真正决定了系统的适应性、可扩展性和可持续性
  • 无论高层设计多么出色,如果底层代码库缺乏可扩展性,那么对新用例的适应性就会成为一项艰巨的任务。现实世界的系统需要有远见的设计和代码的和谐结合,可以根据需要灵活地增长和适应。


8、“反向搜索 Netflix 的联合图”

  • 描述 Netflix 联合图内反向搜索功能的开发
  • 解释在 Elasticsearch 中使用 percolator 字段来启用反向搜索
  • 涵盖 SavedSearches 的渗透索引管道的实现
  • 介绍了如何使用反向搜索进行电影分类和工作流程分配
  • 电影匹配服务提供了一种根据匹配标准的任意组合对电影进行分类的方法。在幕后,匹配标准存储为反向搜索,并且为了确定电影与哪个标准匹配,电影的文档被提交到反向搜索端点。
  • 介绍反向搜索未来可能用于创建响应式 UI 和 GraphQL 订阅

9、“KubeCon EU 2024 技术趋势:GitOps、AI 炒作、可调试性等”

  • 讨论 GitOps 和 Service Mesh 的扩展,以庆祝 Kubernetes 十周年
  • 描述了 Backstage、KCL 和 Argo 等社区驱动项目的巨大增长,强调了社区在开源中的重要性
  • 探讨软件应用中对人工智能的持续关注,特别强调 Kubernetes 在人工智能革命中的作用