七月中旬大科技工程文摘

包含来自 Discord、Expedia、Pinterest、Booking 等的文章!


1. “驾驭 Web 进化:与 Addy Osmani 就 Web 开发和开发者成长进行深入访谈”
Wix ⸱ 阅读时间 12 分钟 ⸱ 7 月 16 日
Addy 讨论了在 Web 开发测试中如何平衡质量和敏捷性,介绍了如何在瞬息万变的行业中选择重点关注哪些技术。他分享了他对浏览器设计演变和潜在改进领域的看法,并介绍了浏览器性能的潜在变革因素,包括 WebAssembly 和 AI 驱动的优化。
强烈推荐阅读!


2. “弃用遗留微服务的风险”
作者:Shashank Jha ⸱ Expedia ⸱ 阅读时间:4 分钟 ⸱ 7 月 10 日

  • 探索 Expedia 集团航班详情堆栈现代化的历程
  • 描述该项目的动机和整合Cassandra 的提议
  • 涵盖所面临的挑战,包括序列化库和升级基础设施的问题
  • 分享引入Redis作为替代方案的决定及其带来的好处,包括简化的PubSub实施和成本节省

其他:

“构建你自己的 GPT(BYO-GPT)”
作者 Rajat Gupta ⸱ Walmart ⸱ 阅读时间 7 分钟 ⸱ 7 月 8 日
如何为个人数据构建定制的 GPT 并避免将敏感信息暴露给外部 API?

“Discord 如何使用开源工具进行可扩展数据编排和转换”
Discord ⸱ 2 分钟阅读 ⸱ 7 月 12 日
本文提出了使用 Dagster 和 dbt 组合的决定,强调了 Dagster 对 Kubernetes、声明式自动化和用户友好型 UI 的支持。

“利用 RAG 解锁视频知识共享”
作者:Alon Faktor ⸱ Vimeo ⸱ 阅读时间:13 分钟 ⸱ 7 月 15 日

  • 介绍 Vimeo 的新视频问答系统,该系统使用生成式 AI 来讨论视频内容
  • 探索使用RAG (检索增强生成)来回答有关特定文本数据库的问题
  • 讨论自下而上处理问答视频记录的方法
  • 介绍不使用面部识别的说话人检测技术
  • 介绍如何使用人工智能生成的艺术作品在视频中寻找准确的参考点,并自动生成新的问题供观众提出

“优化拣货流程,让 Instamart 能够更快地交货”
作者:Sonakshi Gupta ⸱ Swiggy ⸱ 阅读时间:7 分钟 ⸱ 7 月 10 日

  • 描述 Instamart 在暗店拣货流程高峰时段的时间延迟问题
  • 介绍批量拣货订单的解决方案以提高效率
  • 通过数学模型和算法实现批量拣选
  • 分享模拟结果,验证批量拣选的有效性
  • 概述批量拣选如何减少拣选员分配时间和行程时间,从而提高整体效率

“AWS 简单电子邮件服务安全性”
作者:Tom Spencer ⸱ Capgemini ⸱ 阅读时间:1 分钟 ⸱ 7 月 12 日

“利用图形技术进行实时欺诈检测和预防”
作者:Deepak Patankar ⸱预订⸱ 阅读 6 分钟 ⸱ 7 月 10 日

  • 描述 Booking.com 背景下的欺诈检测和预防挑战
  • 引入以图表形式表示请求的概念,用于实时欺诈检测
  • 分享图表随时间演变并揭示可疑模式的示例
  • 解释如何使用图表进行实时欺诈检测以及构建图表的技术要求
  • 涵盖欺诈检测服务和图形服务的系统组件和设计

“以下是我们在柏林 Google I/O Connect 大会上了解到的信息”
作者:Ed Holloway-George ⸱ ASOS ⸱ 阅读时间:1 分钟 ⸱ 7 月 17 日

“识别 LLM 中不安全输出处理漏洞的 4 阶段指南”
作者 Zeev Kalyuzhner ⸱ Wix ⸱ 阅读时间 3 分钟 ⸱ 7 月 15 日

  • 探讨 LLM 中不安全输出处理的漏洞
  • 描述恶意行为者如何利用此漏洞破坏系统并访问私人数据
  • 涵盖训练数据中毒的概念及其对 LLM 完整性的影响
  • 介绍利用漏洞入侵系统的实际场景

“使用 Karate 简化 GraphQL 服务测试”
trivago ⸱ 阅读 10 分钟 ⸱ 7 月 8 日

  • 描述 trivago 如何将其现有的 GraphQL 单体重构为微服务架构
  • 探索测试 GraphQL 服务的挑战,包括嵌套数据结构和错误处理
  • 分享如何整合测试框架 Karate 来解决测试挑战
  • 介绍使用 Justfiles 来抽象复杂任务并确保跨平台兼容性
  • 涵盖部署到生产环境之前测试更改的蓝绿发布策略的实施

“构建 Pinterest Canvas,一种文本到图像的基础模型”
作者:Pinterest Engineering ⸱ Pinterest ⸱ 阅读时间:7 分钟 ⸱ 7 月 10 日

  • 介绍了 Pinterest Canvas 的开发,这是一种文本到图像的基础模型,用于增强平台上现有的图像和产品
  • 讨论基础文本转图像模型的训练、生成逼真背景的微调过程,以及针对图像风格的上下文学习过程
  • 解释如何使用强化学习来鼓励 Canvas 生成多样化且具有视觉吸引力的图像
  • 描述背景生成的微调过程,包括训练阶段和纳入修复的附加信息
  • 分享 Pinterest Canvas 模型的未来改进,包括升级到更现代的 Transformer 扩散架构,并重新思考二元掩码模型调节方法