Salesforce AI云、谷歌AI虚拟试穿等上周AI产品新闻


Uber计划在其叫车、送餐和酒类销售业务中引入全长视频广告;据首席执行官达拉Khosrowshahi)称,Uber的广告基数同比增长了80%

Twitter首席执行官琳达Yaccarino计划通过视频,商业和创作者合作伙伴关系,更多视频内容和支付使Twitter的业务多样化,不再依赖数字广告

梅塔发布 了MusicGen,一个开源的人工智能音乐生成器,被描述为“ChatGPT音频;经过 20,000小时的授权音乐训练,MusicGen可以根据文本或旋律提示创作新歌; Facebook   的Hugging Face AI网站上现在有一个演示demo[url=https://huggingface.co/spaces/facebook/MusicGen] is now available[/url] 

MusicGen 由公司内部的 Audiocraft 团队开发,就像是ChatGPT的音乐版。你输入一段关于你想听的音乐类型的简短文字描述,点击生成,在很短的时间内,AI 就会根据你的指令创建一个 12 秒长的曲目。

可以通过上传您自己的歌曲来“操纵”MusicGen,这样 AI 就有更好的结构感。

音乐家不必担心失去自己的职业:AI 只是擅长制作简单、简短的旋律,但除此之外就不多了。质量与人为创造的东西不在同一水平上。
由于 MusicGen 多次循环相同的进行,一些歌曲可能会变得非常重复。
此工具可用于为视频或演示文稿创建纯背景音频,但没有真正吸引人的地方。
下一个流行歌曲不会由 AI 生成——至少现在还不会。 


梅塔推出了 Voicebox,这是一种人工智能模型,可以从文本提示中生成合成语音; 该模型是在来自有声读物的超过50,000小时未经过滤的语音的多样化数据集上训练 的,包括不同的语言。

Voicebox 可以制作高质量的音频剪辑并编辑预先录制的音频——例如移除汽车喇叭或狗叫声——同时保留音频的内容和风格。该模型也是多语言的,可以产生六种语言的语音。

Voicebox 的多功能性支持各种任务,包括:

  • 上下文文本到语音合成:使用短至两秒的音频样本,Voicebox 可以匹配音频风格并将其用于文本到语音生成。
  • 语音编辑和降噪:Voicebox 可以重新创建被噪音打断的部分语音或替换说错的词,而无需重新录制整个语音。例如,您可以识别被狗叫声打断的一段语音,将其裁剪,然后指示 Voicebox 重新生成该段——就像用于音频编辑的橡皮擦一样。
  • 跨语言风格转换:当给定 某人的演讲样本和一段英语、法语、德语、西班牙语、波兰语或葡萄牙语的文本时,Voicebox 可以生成任何这些语言的文本阅读,即使样本语音和文本是不同的语言。将来可以使用此功能来帮助人们以自然、真实的方式进行交流,即使他们不会说同一种语言。
  • Diverse speech sampling :从不同的数据中学习后,Voicebox 可以生成更能代表人们在现实世界中使用上述六种语言的谈话方式的语音。


Alphabet 警告员工 不要与人工智能聊天机器人分享机密信息,包括其自己的Bard; 人工智能语言模型通常会对用户数据进行训练,如果机器人在未来的聊天中复制数据,可能会导致机密信息泄露

谷歌推出了一款基于人工智能的 虚拟试穿工具;谷歌的试穿工具基于精选的人体模型图像;该工具 可以调整衣服的图像,以显示它在每个模型上的外观

谷歌推出了一项新的购物功能,以弥补至少一个差距——由 AI 提供支持的女式上衣虚拟试穿。购物者可以使用该工具查看一件商品在一系列具有不同肤色、体型、种族甚至发型的模特身上的样子。

Google 正在与 Anthropologie、Everlane、H&M 和 Loft 等品牌合作。从一张产品图片开始,其生成的 AI 模型展示了它如何在从 XXS 到 4XL 尺寸的 80 种型号上进行悬垂、折叠、紧贴和拉伸。目标是在购物过程中代表各种体型,减少不满意的顾客数量,并最终退货。

服装是谷歌搜索最多的购物类别之一,但购物者并不总能得到他们想要的东西:59% 的在线购物者对他们购买的商品不满意,因为它看起来不像他们预期的那样,42根据 Google 调查数据,% 的人表示他们认为在产品列表中看到的模特图片不代表他们。

谷歌正在使用其 Shopping Graph 推出新的虚拟试穿技术——一个包含超过 350 亿个产品列表的数据集。该公司计划在今年晚些时候推出男士上衣虚拟试穿。


谷歌更新了其Google透镜应用程序,增加了 其他功能,包括识别皮肤状况的工具;使用Google Lens,用户可以上传图片以搜索皮肤状况的视觉匹配,例如痣或皮疹,或嘴唇隆起,指甲线或脱发等身体问题

智能镜头有一种新方法可以提供帮助,它能够搜索与您在皮肤上看到的视觉上相似的皮肤状况。只需通过智能镜头拍照或上传照片,您就会找到视觉匹配项来为您的搜索提供信息。如果您不确定如何描述身体上的其他情况(例如嘴唇上的肿块、指甲上的皱纹或头上的脱发)

亚马逊正在测试一项功能,该功能使用AI来总结其购物应用程序上的客户评论,提供利弊的简要概述

Spotify正在改变其早期的内容独占战略,将其价值超过10亿美元的播客业务转向为制作人提供工具并产生广告收入,类似于YouTube的模式

Streamlabs为内容创作者推出了播客编辑器,具有AI辅助工具,用于基于文本的编辑,自动转录生成以及30种语言的实时翻译

Canva推出了一个开发者平台,其中包括API和开发工具,可以访问其1.35亿MAU;该公司还宣布了一项5000万美元的基金来支持应用程序开发人员:

视觉交流平台Canva今天在旧金山举行的首届开发者大会Canva Extend上推出了 Canva 开发者平台。新平台由一套全面的 API 和开发工具组成,使开发人员能够与 Canva 1.35 亿强大的月活跃用户群建立联系。

该产品的一个重要组成部分是 Canva Apps SDK,它允许访问 javascript 库、文档、示例应用程序、UI 指南等资源,尤其是新的 Canva Apps API。


Salesforce正在推出 AI Cloud,这是一套企业就绪的AI工具;该解决方案与各种Salesforce应用程序集成并托管AI模型,包括来自AWS,OpenAI,Anthropic,Cohere等的文本生成器:

AI Cloud 在 Salesforce 的云基础设施上托管和服务来自一系列合作伙伴的 AI 模型——特别是文本生成模型,包括 Amazon Web Services、Anthropic、Cohere 和 OpenAI。第一方模型可从 Salesforce 的 AI 研究部门获得,支持代码生成和业务流程自动化等功能。或者,客户可以将定制训练的模型引入平台,同时将数据存储在自己的基础设施上。

这与亚马逊最近推出的 Bedrock相差无几,后者提供了一系列由 AWS 内部训练的模型以及来自初创合作伙伴的预训练模型。

AI Cloud 中 Salesforce 构建的模型为 Salesforce 旗舰产品(包括 Data Cloud、Tableau、Flow 和 MuleSoft)的新功能提供支持。总共有九种模型:Sales GPT、Service GPT、Marketing GPT、Commerce GPT、Slack GPT、Tableau GPT、Flow GPT 和 Apex GPT。

销售 GPT 可以快速自动制作个性化电子邮件,而服务 GPT 可以根据案例数据和客户历史创建服务简报、案例摘要和工作订单。与此同时,Marketing GPT 和 Commerce GPT 可以生成受众细分,以便根据每个买家的客户数据定​​位和定制产品描述,或者提供如何提高平均订单价值等建议。

Slack GPT、Tableau GPT、Flow GPT 和 Apex GPT 在本质上更专业一些。Slack GPT 和 Flow GPT 允许用户构建嵌入 AI 操作的无代码工作流,无论是在 Slack 还是 Flow 中。Tableau GPT 可以根据自然语言提示和表面数据洞察生成可视化。至于 Apex GPT,它可以扫描代码漏洞并为 Salesforce 的专有编程语言 Apex 建议内联代码。

截至今天,其中一些模型已经上线,包括 Slack GPT、Commerce GPT、Sales GPT 和 Service GPT。