大语言模型LLM

     

Sora竞争对手:圣树科技与清华大学合作推出“Vidu”

22

圣树科技与清华大学合作推出“Vidu”,可以制作16秒长、1080p分辨率的高清视频。可以制作16秒长、1080p分辨率的高清视频。网友评论:1、很高兴有竞争!看起来不像Sora那么稳定,但很有前途!.

基于Llama-3的OpenBioLLM-70B和8B:在医疗领域优于GPT-4

33 4K

开源再次来袭: OpenBioLLM-Llama3-70B 和 8B 的发布。这些模型在生物医学领域超越了Openai 的 GPT-4、Google 的 Gemini、Meditron-70B、Goo.

Llama3可能是产生幻觉最多的小模型

14

一个小模型优点是:非常善于 "说话",而且非常友好,但它确实喜欢胡编乱造:如果你问到一个它没有太多数据的话题,它就会非常肯定地编造出完整的故事。 种小模型的价值有限,无法回答任何非常识性的基本问题。 .

15个本周Github上大模型等有趣项目

32 14K

15个本周Github上大模型等有趣的项目、工具和库1、Aider在终端中进行 AI 配对编程 Aider 是一个命令行工具,可让您将程序与 LLM 配对,以编辑存储在本地 git 存储库中的代码。 .

微软小语言模型Phi-3-mini测试体验

62 3K

微软新的小语言模型 Phi-3-mini,它的性能让人震惊。尽管只有 30 亿个参数,但该模型功能强大,可以在各种任务中提供一流的结果。Phi-3-mini 的效率改变了游戏规则,使我们能够在本地运行.

苹果OpenELM:开源小语言模型

18

OpenELM:具有开源训练和推理框架的高效语言模型系列OpenELM 使用分层缩放策略来有效地分配变压器模型每一层内的参数,从而提高准确性。我们使用CoreNet库预训练 OpenELM 模型。我们.

Llama 3已能在iPhone或安卓手机上运行

128 2K

得益于 MLX Swift,Llama 3 已在 iPhone 上本地运行: Llama 3 在 iPhone 上运行的速度约为 8.5t/s, 它可以在 Android 上运行吗?回答是肯定的,可以.

如何将LLaMA 3部署到生产中以及硬件要求?

214 6K

Meta 几天前发布了 LLaMA 3 生成式 AI 模型,它已经显示出令人印象深刻的功能。通过此分步指南了解如何安装 LLaMA 3 并将其部署到生产环境中。从硬件要求到部署和扩展,我们涵盖了您顺利.

微软小语言模型Phi-3-Mini-4K-Instructk开源发布

38 3K

Phi-3-Mini-4K-Instruct 是一个 3.8B 参数、轻量级、最先进的开放模型,使用 Phi-3 数据集进行训练,其中包括合成数据和经过过滤的公开可用网站数据,重点是高品质和推理密集的.

苹果将使用本地大模型?

31

苹果的下一件大事:设备上的大型语言模型。该公司正在探索一些 "下一个大事件 "项目,包括增强现实眼镜和个人机器人。不过,今年晚些时候,苹果将向更先进的人工智能领域进军,这将是一项更具挑战性的努力。在这.

开放Llama-3可能颠覆了封闭人工智能模型

33 4K

Meta 仅在三天前发布了 Llama-3,感觉开源模型最终缩小了与专有模型的差距已经是一个拐点。初始基准测试显示 Llama-3 70B 在许多任务中与 GPT-4 非常接近: 官方Meta 页面仅.

伸缩架构原理也适用于大模型

25

谷歌的Griffin论文完美地展示了缩放定律。由于参数扩展了 7 倍,任务性能提高了大约 10%。全部都使用相同的 3000 亿代币数据进行训练。当您跨参数扩展时,模型会获得更高的样本效率或更好的推断.

10个最新开源大模型Llama 3应用

61

Llama 3改变了LLM游戏。人们在GPT-4水平上发现了开源用例,在开源社区中有一场大规模的运动。10个例子(以及使用Llama 3的方法):1.在Raspberry Pi 5上运行的Llama .

VSCode中使用Llama 3简单教程

136 11K
展示如何使用今天Meta发布的这个令人惊叹的模型!Llama 3作为VSCode中的副驾驶要求: 在VSCode中安装CodeGPT扩展插件: CodeGPT下载链接 现在在Vscode终端中运行以下.

Meta开源Llama 3发布

32 1

Meta发布迄今为止最有能力的开源大模型:Llama 3 要点: 此次发布 Llama(Meta Llama 3)的前两个型号,可供广泛使用。此版本具有经过预训练和指令微调的语言模型,具有 8B 和 .

使用Claude3而非ChatGPT五个理由

40 3K

本文探讨了开始使用 Claude 3 而不是 ChatGPT 的 5 个理由,强调了其先进的功能、增强的准确性和更广泛的上下文理解。无论您是技术专业人士、好奇的新手,还是介于两者之间,了解这些原因都可.

视频编辑领域AI革命:Adobe Premiere Pro 与 OpenAI 合作

24 2K

视频编辑世界正处于一场革命的风口浪尖。 Adobe 是拥有广泛使用的 Premiere Pro 软件的行业领导者,它正在探索与专门从事人工智能 (AI) 的尖端研究实验室 OpenAI 建立合作伙伴关.

大模型是否成功支持了维特根斯坦“意义即使用”?

39 1 3K

比特币为啥有用?不是它本身用多少黄金 石油做标的,不是它本身指向了多少实在物质,而是有人使用它,只要被使用就有价值,而不在于该符号本身有多少价值。我们所说的 "成功 "是指当前的人工智能/LLM 能够.

近期大模型AIGC概要:Adobe发布AI编辑视频等

16 4K

视频编辑将像简单的文本提示一样简单。Adobe 的最新预告展示了多种令人兴奋的工具和主要集成,这可能会开创视频制作的全新时代。让我们探索一下……在近期人工智能概要中: Adobe 预览 AI 视频功能.

谷歌Aloha Unleashed能进行机器人维修、系鞋带和挂衬衫

26

在过去的一年里,我们一直在开发 ALOHA Unleashed @GoogleDeepmind - 推动我们的 ALOHA 2 机群任务的规模和灵巧性。ALOHA Unleashed:用低成本机器人和.

AGI来了?特拉斯用大模型帮助自动驾驶

50

Grok-1.5V能将“像素->动作”映射提升为“像素->语言->动作”。Tesla FSD v13可能会是Grokking语言令牌。Grok-1.5V最让人兴奋的是解决自动驾驶中边缘情况的潜力。使用.

AI Devin第一次成为自己代码库的最大贡献者

79

今天,Devin 的一次新更新导致内部使用量比之前的记录翻了一番还多。今天,Devin 首次成为 Devin 代码库的最大贡献者...如果这是真的,这将是递归自我完善的重要一步,而这件事将会滚雪球般越.

近期大模型AIGC概要:Grok 1.5 视觉升级等

31 4K

埃隆·马斯克 (Elon Musk) 的使命是证明开源人工智能可以与最好的人工智能竞争,而 Grok 的最新升级刚刚向前迈出了一大步。凭借超越顶级模型的新多模态能力,xAI 正在悄悄地展现出自己是人工.

快速实现业务规则的开源API逻辑服务器简介

35 2K

API Logic Server 是一个开源 Python 项目。它是一个用于项目创建的CLI,以及用于项目执行的一组运行时(SAFRS API、Flask、SQLAlchemy ORM、业务逻辑引擎.

Poe为AI创建者提供一种收入模式

25 2K

人工智能聊天机器人的世界正在不断发展,而 Quora 的创意之作 Poe 则处于这一发展的最前沿。为了帮助创作者并加速创新,Poe为人工智能机器人创作者引入了按消息定价的收入模式。这意味着开发人员现在.

本周Github上17款有趣项目LLocalSearch等

39 13K

本周Github上有趣的项目、工具和库1、LLocalSearchLLocalSearch 是一个使用 LLM 代理的完全本地运行的搜索聚合器。用户可以提出问题,系统将使用一系列大模型来找到答案。用户.

谷歌推出无限上下文的新Transformer

160 1 5K

谷歌这项研究引入了一种有效的方法,可以将基于 Transformer 的大型语言模型 (LLM) 扩展到具有有限内存和计算的无限长输入。一个关键组成部分是一种称为“无限注意力 Infini-atten.

大模型不只是语言能力,还是对广阔世界的理解

30 2K

这篇发人深省的文章基本上是在大声疾呼:机器人推理的通用智能AGI基础模型可能在今天就已经存在。 LLM 不仅仅关乎特定语言的能力,还关乎对广阔世界的理解。这篇文章介绍了一种名为“Keypoint Ac.

​​​​​​​通用人工智能已经到来

28 7K

当今最先进的人工智能模型存在许多缺陷,但几十年后,它们将被公认为通用人工智能的第一个真实例子。什么是通用智能?早期的人工智能系统表现出人工的狭义智能,专注于单一任务,有时执行任务的能力接近或超过人类水.