AI直播换脸:安能辨雌雄?

11 26K
AI直播实时换脸 难点是脸部表情,眼睛转动,嘴巴嘴型需要实时生动:点击标题 见视频: .

微软小语言模型Phi-3-mini测试体验

25 3K
微软新的小语言模型 Phi-3-mini,它的性能让人震惊。尽管只有 30 亿个参数,但该模型功能强大,可以在各种任务中提供一流的结果。Phi-3-mini 的效率改变了游戏规则,使我们能够在本地运行.

苹果OpenELM:开源小语言模型

7
OpenELM:具有开源训练和推理框架的高效语言模型系列OpenELM 使用分层缩放策略来有效地分配变压器模型每一层内的参数,从而提高准确性。我们使用CoreNet库预训练 OpenELM 模型。我们.

VASA-1:将图像转换为视频的AI模型

15 2K
想象一下,让一幅珍贵的肖像栩栩如生,让人物说话并表达情感。得益于微软突破性的VASA-1 AI 模型,这一未来概念现在更接近现实。这是一种新的人工智能模型,可以将一张照片和一段音频变成完全逼真的深度伪.

Llama 3已能在iPhone或安卓手机上运行

54 2K
得益于 MLX Swift,Llama 3 已在 iPhone 上本地运行: Llama 3 在 iPhone 上运行的速度约为 8.5t/s, 它可以在 Android 上运行吗?回答是肯定的,可以.

如何将LLaMA 3部署到生产中以及硬件要求?

65 6K
Meta 几天前发布了 LLaMA 3 生成式 AI 模型,它已经显示出令人印象深刻的功能。通过此分步指南了解如何安装 LLaMA 3 并将其部署到生产环境中。从硬件要求到部署和扩展,我们涵盖了您顺利.

微软小语言模型Phi-3-Mini-4K-Instructk开源发布

26 3K
Phi-3-Mini-4K-Instruct 是一个 3.8B 参数、轻量级、最先进的开放模型,使用 Phi-3 数据集进行训练,其中包括合成数据和经过过滤的公开可用网站数据,重点是高品质和推理密集的.

苹果将使用本地大模型?

28
苹果的下一件大事:设备上的大型语言模型。该公司正在探索一些 "下一个大事件 "项目,包括增强现实眼镜和个人机器人。不过,今年晚些时候,苹果将向更先进的人工智能领域进军,这将是一项更具挑战性的努力。在这.

开放Llama-3可能颠覆了封闭人工智能模型

25 4K
Meta 仅在三天前发布了 Llama-3,感觉开源模型最终缩小了与专有模型的差距已经是一个拐点。初始基准测试显示 Llama-3 70B 在许多任务中与 GPT-4 非常接近: 官方Meta 页面仅.

在CPython中实现纯Python函数的真正并行性

16 8K
CPython 是最常见的 Python 实现,被全球数百万开发人员广泛使用。然而,在 CPython 进程中实现真正的并行性一直是一个难题。在这里,我们将尝试在操作系统和 Python 的背景下更好.

伸缩架构原理也适用于大模型

25
谷歌的Griffin论文完美地展示了缩放定律。由于参数扩展了 7 倍,任务性能提高了大约 10%。全部都使用相同的 3000 亿代币数据进行训练。当您跨参数扩展时,模型会获得更高的样本效率或更好的推断.

10个最新开源大模型Llama 3应用

53
Llama 3改变了LLM游戏。人们在GPT-4水平上发现了开源用例,在开源社区中有一场大规模的运动。10个例子(以及使用Llama 3的方法):1.在Raspberry Pi 5上运行的Llama .

Meta开源Llama 3发布

30 1
Meta发布迄今为止最有能力的开源大模型:Llama 3 要点: 此次发布 Llama(Meta Llama 3)的前两个型号,可供广泛使用。此版本具有经过预训练和指令微调的语言模型,具有 8B 和 .

使用Claude3而非ChatGPT五个理由

38 3K
本文探讨了开始使用 Claude 3 而不是 ChatGPT 的 5 个理由,强调了其先进的功能、增强的准确性和更广泛的上下文理解。无论您是技术专业人士、好奇的新手,还是介于两者之间,了解这些原因都可.

谷歌照片AI编辑功能即将上架所有安卓设备

24 3K
对于喜欢 Google 相册的 Android 用户来说是个好消息!谷歌将于五月份推出一套功能强大的人工智能照片编辑工具,所有人都可以使用,无需订阅。此更新将改变您在 Android 设备上的照片编辑.

视频编辑领域AI革命:Adobe Premiere Pro 与 OpenAI 合作

21 2K
视频编辑世界正处于一场革命的风口浪尖。 Adobe 是拥有广泛使用的 Premiere Pro 软件的行业领导者,它正在探索与专门从事人工智能 (AI) 的尖端研究实验室 OpenAI 建立合作伙伴关.

AI研究中数学和算法哪个优先?

23 3K
问题:我现在正在学习扩散背后的方法(DDPM、基于分数的方法和其他方法)。我想知道研究人员究竟是如何提出这个想法的?发明新方法的过程是这样的吗?我们想制作更好的图像生成器。哦,数据永远都不够......

大模型是否成功支持了维特根斯坦“意义即使用”?

38 1 3K
比特币为啥有用?不是它本身用多少黄金 石油做标的,不是它本身指向了多少实在物质,而是有人使用它,只要被使用就有价值,而不在于该符号本身有多少价值。我们所说的 "成功 "是指当前的人工智能/LLM 能够.

近期大模型AIGC概要:Adobe发布AI编辑视频等

14 4K
视频编辑将像简单的文本提示一样简单。Adobe 的最新预告展示了多种令人兴奋的工具和主要集成,这可能会开创视频制作的全新时代。让我们探索一下……在近期人工智能概要中: Adobe 预览 AI 视频功能.

谷歌Aloha Unleashed能进行机器人维修、系鞋带和挂衬衫

24
在过去的一年里,我们一直在开发 ALOHA Unleashed @GoogleDeepmind - 推动我们的 ALOHA 2 机群任务的规模和灵巧性。ALOHA Unleashed:用低成本机器人和.

DuckDB简介

46 7K
DuckDB是一个内存分析型关系数据库,主要用于数据分析。由于其列式存储性质(单独存储每列的数据),它被视为分析数据库。相比之下,传统的关系数据库采用基于行的存储,逐行存储数据。DuckDB 的优点包.

AI Devin第一次成为自己代码库的最大贡献者

74
今天,Devin 的一次新更新导致内部使用量比之前的记录翻了一番还多。今天,Devin 首次成为 Devin 代码库的最大贡献者...如果这是真的,这将是递归自我完善的重要一步,而这件事将会滚雪球般越.

近期大模型AIGC概要:Grok 1.5 视觉升级等

30 4K
埃隆·马斯克 (Elon Musk) 的使命是证明开源人工智能可以与最好的人工智能竞争,而 Grok 的最新升级刚刚向前迈出了一大步。凭借超越顶级模型的新多模态能力,xAI 正在悄悄地展现出自己是人工.

Scikit-learn SVM 实现

20
支持向量机 (SVM) 是用于分类、回归和异常值检测任务的最通用和最广泛使用的机器学习算法之一。在 SVM 实现领域,Scikit-learn 因其易用性和鲁棒性而成为首选库。然而,掌握 Scikit.

谷歌推出Google Vids新AI视频应用

23 2K
 Google 在其 Workspace 套件中推出了一款革命性工具:Google Vids。这款创新的人工智能视频创作应用程序让每个人都可以进行视频制作,改变企业沟通和讲述故事的方式。要点: Goo.

Poe为AI创建者提供一种收入模式

22 2K
人工智能聊天机器人的世界正在不断发展,而 Quora 的创意之作 Poe 则处于这一发展的最前沿。为了帮助创作者并加速创新,Poe为人工智能机器人创作者引入了按消息定价的收入模式。这意味着开发人员现在.

随机学习简介

24 2K
了解随机学习:深入研究自适应和高效的机器学习在机器学习领域,算法旨在从数据中学习并做出预测或决策,随机学习作为一种强大且多功能的方法脱颖而出。随机学习方法因其效率和适应性而备受赞誉,在解决从金融和医疗.

谷歌推出无限上下文的新Transformer

159 1 5K
谷歌这项研究引入了一种有效的方法,可以将基于 Transformer 的大型语言模型 (LLM) 扩展到具有有限内存和计算的无限长输入。一个关键组成部分是一种称为“无限注意力 Infini-atten.

大模型不只是语言能力,还是对广阔世界的理解

29 2K
这篇发人深省的文章基本上是在大声疾呼:机器人推理的通用智能AGI基础模型可能在今天就已经存在。 LLM 不仅仅关乎特定语言的能力,还关乎对广阔世界的理解。这篇文章介绍了一种名为“Keypoint Ac.