联发科AI会根据输入实时生成图像


2024 年世界移动通信大会在巴塞罗那举行,吸引了来自世界各地的数百家参展商。

1、MediaTek SDXL Turbo:文本转图像人工智能引擎
联发科技有一个演示设备来展示其使用天玑 9300 SoC 的 SDXL Turbo AI 引擎。文本到图像人工智能位于设备上,并在您键入时实时生成图像。

  • 它们看起来并不真实,但生成新图像的速度令人惊叹。
  • 图像是动态的,并且随着您键入的每个单词(有时是字符)而变化。

如果这是真的,我们为什么还要买 4090?

  • 手机上运行的模型似乎是 sdxl Turbo,因此 SDXL 的精炼版本(意味着参数更少,因此推理速度更快)可能具有相同的质量。
  • 许多技巧已经可以用于实时生成,例如LCM Lora,但是更快的推理会降低整体质量,但是没有独立的评估在许多提示上详尽地比较这些技巧的优点/缺点。
  • 拥有 4090 不仅有利于运行快速推理和更大/更好的模型,而且还可以进行模型微调、dreambooth、文本嵌入训练等等!
  • 在 4090 上运行 SDXL,渲染 1024×1024 图像仍然需要 7-10 秒。

廉价手机芯片制造商推出了一款 SoC,其性能可以像 4080 一样,而且不需要冷却?

  • 联发科芯片不需要接近 4080 的性能。首先使用该模型的 Turbo 版本,牺牲质量以换取速度。
  • 其次,分辨率也相当低,这大大提高了性能。

2、荣耀Magic Capsule演示:手机眼动追踪
Honor的Magic 6 Pro智能手机包含一项名为Magic Capsule的功能。它就像动态岛,但它不是在实时活动视图中自动显示通知,而是跟踪您的眼睛以了解您在看哪里,一旦发现,它就会向您显示通知内容。

该公司有一辆汽车连接到 Magic 6 Pro。我在几秒钟内校准了眼睛,只需看手机就可以控制汽车。我启动了发动机,来回移动它,然后关闭了发动机——凝视了几眼。必须注意的是,这只是为了演示目的,它不是 Magic Capsule 的用例之一。

虽然Magic 6 Pro现已在全球上市,但该功能尚未推出,因为荣耀仍在针对更广泛的人群进行培训。它的工作原理是借助手机的飞行时间 (ToF) 传感器来跟踪您的眼睛。