大语言模型LLM

Sora竞争对手：圣树科技与清华大学合作推出“Vidu”

24-04-28 22

圣树科技与清华大学合作推出“Vidu”，可以制作16秒长、1080p分辨率的高清视频。可以制作16秒长、1080p分辨率的高清视频。网友评论：1、很高兴有竞争！看起来不像Sora那么稳定，但很有前途！.

基于Llama-3的OpenBioLLM-70B和8B：在医疗领域优于GPT-4

24-04-28 33 4K

开源再次来袭： OpenBioLLM-Llama3-70B 和 8B 的发布。这些模型在生物医学领域超越了Openai 的 GPT-4、Google 的 Gemini、Meditron-70B、Goo.

Llama3可能是产生幻觉最多的小模型

24-04-27 14

一个小模型优点是：非常善于 "说话"，而且非常友好，但它确实喜欢胡编乱造：如果你问到一个它没有太多数据的话题，它就会非常肯定地编造出完整的故事。种小模型的价值有限，无法回答任何非常识性的基本问题。 .

15个本周Github上大模型等有趣项目

24-04-26 32 14K

15个本周Github上大模型等有趣的项目、工具和库1、Aider在终端中进行 AI 配对编程 Aider 是一个命令行工具，可让您将程序与 LLM 配对，以编辑存储在本地 git 存储库中的代码。 .

微软小语言模型Phi-3-mini测试体验

24-04-25 62 3K

微软新的小语言模型 Phi-3-mini，它的性能让人震惊。尽管只有 30 亿个参数，但该模型功能强大，可以在各种任务中提供一流的结果。Phi-3-mini 的效率改变了游戏规则，使我们能够在本地运行.

苹果OpenELM：开源小语言模型

24-04-25 18

OpenELM：具有开源训练和推理框架的高效语言模型系列OpenELM 使用分层缩放策略来有效地分配变压器模型每一层内的参数，从而提高准确性。我们使用CoreNet库预训练 OpenELM 模型。我们.

Llama 3已能在iPhone或安卓手机上运行

24-04-24 128 2K

得益于 MLX Swift，Llama 3 已在 iPhone 上本地运行： Llama 3 在 iPhone 上运行的速度约为 8.5t/s，它可以在 Android 上运行吗？回答是肯定的，可以.

如何将LLaMA 3部署到生产中以及硬件要求?

24-04-24 214 6K

Meta 几天前发布了 LLaMA 3 生成式 AI 模型，它已经显示出令人印象深刻的功能。通过此分步指南了解如何安装 LLaMA 3 并将其部署到生产环境中。从硬件要求到部署和扩展，我们涵盖了您顺利.

微软小语言模型Phi-3-Mini-4K-Instructk开源发布

24-04-24 38 3K

Phi-3-Mini-4K-Instruct 是一个 3.8B 参数、轻量级、最先进的开放模型，使用 Phi-3 数据集进行训练，其中包括合成数据和经过过滤的公开可用网站数据，重点是高品质和推理密集的.

苹果将使用本地大模型？

24-04-23 31

苹果的下一件大事：设备上的大型语言模型。该公司正在探索一些 "下一个大事件 "项目，包括增强现实眼镜和个人机器人。不过，今年晚些时候，苹果将向更先进的人工智能领域进军，这将是一项更具挑战性的努力。在这.

开放Llama-3可能颠覆了封闭人工智能模型

24-04-23 33 4K

Meta 仅在三天前发布了 Llama-3，感觉开源模型最终缩小了与专有模型的差距已经是一个拐点。初始基准测试显示 Llama-3 70B 在许多任务中与 GPT-4 非常接近：官方Meta 页面仅.

伸缩架构原理也适用于大模型

24-04-22 25

谷歌的Griffin论文完美地展示了缩放定律。由于参数扩展了 7 倍，任务性能提高了大约 10%。全部都使用相同的 3000 亿代币数据进行训练。当您跨参数扩展时，模型会获得更高的样本效率或更好的推断.

10个最新开源大模型Llama 3应用

24-04-22 61

Llama 3改变了LLM游戏。人们在GPT-4水平上发现了开源用例，在开源社区中有一场大规模的运动。10个例子（以及使用Llama 3的方法）：1.在Raspberry Pi 5上运行的Llama .

VSCode中使用Llama 3简单教程

24-04-19 136 11K

展示如何使用今天Meta发布的这个令人惊叹的模型！Llama 3作为VSCode中的副驾驶要求：在VSCode中安装CodeGPT扩展插件： CodeGPT下载链接现在在Vscode终端中运行以下.

Meta开源Llama 3发布

24-04-19 32 1

Meta发布迄今为止最有能力的开源大模型：Llama 3 要点：此次发布 Llama（Meta Llama 3）的前两个型号，可供广泛使用。此版本具有经过预训练和指令微调的语言模型，具有 8B 和 .

使用Claude3而非ChatGPT五个理由

24-04-18 40 3K

本文探讨了开始使用 Claude 3 而不是 ChatGPT 的 5 个理由，强调了其先进的功能、增强的准确性和更广泛的上下文理解。无论您是技术专业人士、好奇的新手，还是介于两者之间，了解这些原因都可.

视频编辑领域AI革命：Adobe Premiere Pro 与 OpenAI 合作

24-04-18 24 2K

视频编辑世界正处于一场革命的风口浪尖。 Adobe 是拥有广泛使用的 Premiere Pro 软件的行业领导者，它正在探索与专门从事人工智能 (AI) 的尖端研究实验室 OpenAI 建立合作伙伴关.

幽默：请大模型Gemini解释编程基础？

24-04-17 34

大模型是否成功支持了维特根斯坦“意义即使用”？

24-04-17 39 1 3K

比特币为啥有用？不是它本身用多少黄金石油做标的，不是它本身指向了多少实在物质，而是有人使用它，只要被使用就有价值，而不在于该符号本身有多少价值。我们所说的 "成功 "是指当前的人工智能/LLM 能够.

近期大模型AIGC概要：Adobe发布AI编辑视频等

24-04-17 16 4K

视频编辑将像简单的文本提示一样简单。Adobe 的最新预告展示了多种令人兴奋的工具和主要集成，这可能会开创视频制作的全新时代。让我们探索一下……在近期人工智能概要中： Adobe 预览 AI 视频功能.

谷歌Aloha Unleashed能进行机器人维修、系鞋带和挂衬衫

24-04-17 26

在过去的一年里，我们一直在开发 ALOHA Unleashed @GoogleDeepmind - 推动我们的 ALOHA 2 机群任务的规模和灵巧性。ALOHA Unleashed：用低成本机器人和.

AGI来了？特拉斯用大模型帮助自动驾驶

24-04-16 50

Grok-1.5V能将“像素->动作”映射提升为“像素->语言->动作”。Tesla FSD v13可能会是Grokking语言令牌。Grok-1.5V最让人兴奋的是解决自动驾驶中边缘情况的潜力。使用.

AI Devin第一次成为自己代码库的最大贡献者

24-04-16 79

今天，Devin 的一次新更新导致内部使用量比之前的记录翻了一番还多。今天，Devin 首次成为 Devin 代码库的最大贡献者...如果这是真的，这将是递归自我完善的重要一步，而这件事将会滚雪球般越.

近期大模型AIGC概要：Grok 1.5 视觉升级等

24-04-15 31 4K

埃隆·马斯克 (Elon Musk) 的使命是证明开源人工智能可以与最好的人工智能竞争，而 Grok 的最新升级刚刚向前迈出了一大步。凭借超越顶级模型的新多模态能力，xAI 正在悄悄地展现出自己是人工.

快速实现业务规则的开源API逻辑服务器简介

24-04-14 35 2K

API Logic Server 是一个开源 Python 项目。它是一个用于项目创建的CLI，以及用于项目执行的一组运行时（SAFRS API、Flask、SQLAlchemy ORM、业务逻辑引擎.

Poe为AI创建者提供一种收入模式

24-04-13 25 2K

人工智能聊天机器人的世界正在不断发展，而 Quora 的创意之作 Poe 则处于这一发展的最前沿。为了帮助创作者并加速创新，Poe为人工智能机器人创作者引入了按消息定价的收入模式。这意味着开发人员现在.

本周Github上17款有趣项目LLocalSearch等

24-04-13 39 13K

本周Github上有趣的项目、工具和库1、LLocalSearchLLocalSearch 是一个使用 LLM 代理的完全本地运行的搜索聚合器。用户可以提出问题，系统将使用一系列大模型来找到答案。用户.

谷歌推出无限上下文的新Transformer

24-04-12 160 1 5K

谷歌这项研究引入了一种有效的方法，可以将基于 Transformer 的大型语言模型 (LLM) 扩展到具有有限内存和计算的无限长输入。一个关键组成部分是一种称为“无限注意力 Infini-atten.

大模型不只是语言能力，还是对广阔世界的理解

24-04-11 30 2K

这篇发人深省的文章基本上是在大声疾呼：机器人推理的通用智能AGI基础模型可能在今天就已经存在。 LLM 不仅仅关乎特定语言的能力，还关乎对广阔世界的理解。这篇文章介绍了一种名为“Keypoint Ac.

通用人工智能已经到来

24-04-11 28 7K

当今最先进的人工智能模型存在许多缺陷，但几十年后，它们将被公认为通用人工智能的第一个真实例子。什么是通用智能？早期的人工智能系统表现出人工的狭义智能，专注于单一任务，有时执行任务的能力接近或超过人类水.