1、百度推出 LLM 智能眼镜和新图像生成器
据路透社和英国《金融时报》报道:百度首席执行官李彦宏介绍了I-RAG,这是一种文本转图像系统,旨在减少人工智能生成的图像中输出与文本输入不匹配或包含不存在元素的不准确性。
I-RAG 整合了百度的搜索功能和检索增强生成 (RAG),以改善文本提示和生成的图像之间的对齐。
据报道,在讨论该系统时,李使用了“幻觉”一词,但与通常的人工智能语境中的含义不同。虽然幻觉通常是指人工智能文本生成器做出看似事实的错误陈述,但李描述的是图像建模者通常所说的“即时对齐”——模型解释和可视化用户指令的准确程度。
李还表示,百度的人工智能聊天机器人 Ernie被该公司定位为ChatGPT的中国版,目前每天处理 15 亿个用户请求。目前尚不清楚这一数字是否比5 月份报告的 2 亿用户有所增加,因为每个日常用户可能会发送多个请求。
如果增长显著,百度可能会坚持使用相同的指标,以便更好地进行比较。无论如何,它的使用率远低于 ChatGPT。除了消费者产品外,百度还希望在其云和 API 服务中添加 AI 功能。
百度硬件部门小度发布了一款可充当个人助理的新型人工智能耳机。小度首席执行官李颖表示,该设备将摄像头与 Ernie 的语音模型相结合,可实现各种免提功能。
该公司还发布了基于百度语言模型的代码生成工具“秒答”。该系统旨在让没有丰富编程经验的用户更轻松地进行软件开发。
- 百度首席执行官李彦宏在百度世界大会上发布了新的 AI 产品,其中包括 I-RAG 图像生成器,它使用搜索和检索增强生成 (RAG) 来生成更符合提示的图像。
- 百度将 Ernie AI 平台视为 ChatGPT 的中国替代品,目前该平台每天处理 15 亿次用户查询。
- 百度硬件部门小度推出了一款内置基于Ernie语言模型的人工智能助手的耳机,可作为个人助理。
2、阿里巴巴 Qwen AI 部门发布功能强大的新模型,帮助开发人员编写和分析代码
- 阿里巴巴研究部门Qwen推出了一系列名为Qwen-2.5-Coder的全新AI模型,旨在帮助程序员编写、分析和理解代码,模型大小从0.5到320亿个参数不等。
- 这些模型在实际测试中表现出色,既可以集成到 Cursor AI 编辑器中,也可以作为具有工件支持的网络聊天机器人,其中最大的模型 Qwen-2.5-Coder-32B-Instruct 在代码生成基准上优于可用的开源系统。
- Qwen 提高其代码 AI 模型性能的方法依赖于扩展,其模型使用来自公共源代码和与编程相关的网络文本的超过 5.5 万亿个标记进行训练。除 30 亿参数版本外,所有模型均可在 GitHub 上根据 Apache 2.0 许可证获得。
3、OpenAI 联合创始人 Sutskever 预测,随着 LLM 扩展遭遇瓶颈,新的 AI“发现时代”将到来
- 由于传统的预训练扩展方法已经达到极限,人工智能公司正在放弃构建更大的语言模型,转而专注于“测试时间计算”。
- 测试时间计算方法为 AI 模型提供了额外的处理时间来生成多种解决方案,对其进行系统地评估并选择最佳解决方案。
- 尽管 Nvidia 的产品仍然能够完成测试时间计算任务,但这种转变可能会影响 Nvidia 在显卡市场的主导地位,因为推理芯片的竞争加剧。