用还原论方法研究大语言模型?

20
这篇文章(点击标题)介绍了计算机科学家 Ellie Pavlick 的工作,她正在尝试将哲学概念(如“意义”)转化为具体且可测试的想法。Pavlick 在布朗大学和 Google DeepMind 研.

DebateGPT: 与你辩论的人工智能代理

13
DebateGPT是一个自主人工智能代理,旨在使用大型语言模型 (LLM) 和语音识别/合成技术参与辩论。该项目的主要用例是作为参与辩论的个人或团队的辩论对手,特别是在教育或公共演讲环境中。当参与者希.

本周10个Github有趣项目WebLlama等

58 5K
10个Github有趣的项目、工具和库1、WebLlamaLlama-3 网络Web代理,这是使用 Llama 3 构建的最强大的代理,通过聊天对话实现Web导航,可以按照说明浏览网页并与您交谈。在L.

新ChatGPT搜索:search.chatgpt.com域与SSL证书已上线

26
OpenAI 一直在开发一款网络搜索产品。奥特曼在几个播客上明确表示,他们正在研究搜索,这是他特别兴奋的事情。这属于 OpenAI 逐步迈向 AGI 的重要一步。在当今信息爆炸的时代,网络搜索已成为我.

使用大模型Transformer提升商品推荐的用户体验

38 1 3K
ASOS人工智能团队是一个由机器学习工程师和科学家、数据科学家和产品经理组成的跨职能团队,利用机器学习来改善客户体验、提高零售效率并推动增长。banq注:在讨论阿里最大的失败原因时,有网友说:最大的失.

Claude最新九个用户体验测试

19
Anthropic 有一个公司的休闲频道,那里分享在网上看到的酷酷的Claude帖子和有趣的备忘录。自从推出Claude 3 以来,两个月来看到的最喜欢的 9 件事:1、让Claude 3为一个大型神.

幽默:交通标志是一种符号和交通语言

22
世界是在符号计算中: 用交通符号与交警共同编程实现逻辑计算 自动驾驶是理解交通符号语言的大模型:AGI来了?特拉斯用大模型帮助自动驾驶  .

Claude与ChatGPT比较:Claude更有道德?

13 4K
在不断发展的人工智能(AI)世界中,对话式人工智能领域有两大巨头脱颖而出:Claude AI 和 OpenAI 的 ChatGPT。两者都是大型语言模型 (LLM),能够生成人类质量的文本、翻译语言、.

Python与Excel VBA比较

36 7K
众所周知,Python和Excel VBA各自是两种不同的工具,具有不同的范围,最终都具有编程和数据操作领域的功能。Python 被认为是一种多功能、高级、通用的编程语言,以其在当今时代广泛的应用而闻.

Excel与DBMS、Tableau和Power BI比较

23 10K
Microsoft Excel 是一种广泛使用的软件应用程序,几十年来一直是不同办公室和家庭的必备软件。尽管如此,Excel 通常提供了一个多功能平台来组织、分析和可视化特定数据。与 Microsof.

小语言模型指南

29 10K
较小的语言模型通过有效的替代方案挑战较大的语言模型,通过知识蒸馏和迁移学习等技术重塑人工智能。长期以来,人工智能(AI)一直为大型语言模型所吸引,因为它们具有令人印象深刻的能力。然而,最近出现的小型语.

谷歌解雇了整个Python团队

74
据网上报道称,谷歌已将其Python 团队全部员工解雇 ,Python 是一种高度复杂的通用编程语言。谷歌是一家总部位于加州的人工智能驱动的公司,尤其是在当前人工智能热潮中,复杂的人工智能系统一般是用.

Sora竞争对手:圣树科技与清华大学合作推出“Vidu”

33
圣树科技与清华大学合作推出“Vidu”,可以制作16秒长、1080p分辨率的高清视频。可以制作16秒长、1080p分辨率的高清视频。网友评论:1、很高兴有竞争!看起来不像Sora那么稳定,但很有前途!.

基于Llama-3的OpenBioLLM-70B和8B:在医疗领域优于GPT-4

69 4K
开源再次来袭: OpenBioLLM-Llama3-70B 和 8B 的发布。这些模型在生物医学领域超越了Openai 的 GPT-4、Google 的 Gemini、Meditron-70B、Goo.

科学家发明人工突触:可处理复杂信息

16
科学家们一直在寻求提高传统计算机能效的方法,他们从人类大脑中获得灵感,旨在以多种方式模仿其非凡的能力。这些努力导致了类脑计算机的发展,这些计算机不同于传统的二进制处理,而是采用类似于我们大脑的模拟方法.

Llama3可能是产生幻觉最多的小模型

22
一个小模型优点是:非常善于 "说话",而且非常友好,但它确实喜欢胡编乱造:如果你问到一个它没有太多数据的话题,它就会非常肯定地编造出完整的故事。 种小模型的价值有限,无法回答任何非常识性的基本问题。 .

15个本周Github上大模型等有趣项目

46 14K
15个本周Github上大模型等有趣的项目、工具和库1、Aider在终端中进行 AI 配对编程 Aider 是一个命令行工具,可让您将程序与 LLM 配对,以编辑存储在本地 git 存储库中的代码。 .

AI直播换脸:安能辨雌雄?

41 26K
AI直播实时换脸 难点是脸部表情,眼睛转动,嘴巴嘴型需要实时生动:点击标题 见视频: .

微软小语言模型Phi-3-mini测试体验

100 3K
微软新的小语言模型 Phi-3-mini,它的性能让人震惊。尽管只有 30 亿个参数,但该模型功能强大,可以在各种任务中提供一流的结果。Phi-3-mini 的效率改变了游戏规则,使我们能够在本地运行.

苹果OpenELM:开源小语言模型

24
OpenELM:具有开源训练和推理框架的高效语言模型系列OpenELM 使用分层缩放策略来有效地分配变压器模型每一层内的参数,从而提高准确性。我们使用CoreNet库预训练 OpenELM 模型。我们.

VASA-1:将图像转换为视频的AI模型

23 2K
想象一下,让一幅珍贵的肖像栩栩如生,让人物说话并表达情感。得益于微软突破性的VASA-1 AI 模型,这一未来概念现在更接近现实。这是一种新的人工智能模型,可以将一张照片和一段音频变成完全逼真的深度伪.

Llama 3已能在iPhone或安卓手机上运行

175 2K
得益于 MLX Swift,Llama 3 已在 iPhone 上本地运行: Llama 3 在 iPhone 上运行的速度约为 8.5t/s, 它可以在 Android 上运行吗?回答是肯定的,可以.

如何将LLaMA 3部署到生产中以及硬件要求?

395 6K
Meta 几天前发布了 LLaMA 3 生成式 AI 模型,它已经显示出令人印象深刻的功能。通过此分步指南了解如何安装 LLaMA 3 并将其部署到生产环境中。从硬件要求到部署和扩展,我们涵盖了您顺利.

微软小语言模型Phi-3-Mini-4K-Instructk开源发布

66 3K
Phi-3-Mini-4K-Instruct 是一个 3.8B 参数、轻量级、最先进的开放模型,使用 Phi-3 数据集进行训练,其中包括合成数据和经过过滤的公开可用网站数据,重点是高品质和推理密集的.

苹果将使用本地大模型?

36
苹果的下一件大事:设备上的大型语言模型。该公司正在探索一些 "下一个大事件 "项目,包括增强现实眼镜和个人机器人。不过,今年晚些时候,苹果将向更先进的人工智能领域进军,这将是一项更具挑战性的努力。在这.

开放Llama-3可能颠覆了封闭人工智能模型

49 4K
Meta 仅在三天前发布了 Llama-3,感觉开源模型最终缩小了与专有模型的差距已经是一个拐点。初始基准测试显示 Llama-3 70B 在许多任务中与 GPT-4 非常接近: 官方Meta 页面仅.

在CPython中实现纯Python函数的真正并行性

27 8K
CPython 是最常见的 Python 实现,被全球数百万开发人员广泛使用。然而,在 CPython 进程中实现真正的并行性一直是一个难题。在这里,我们将尝试在操作系统和 Python 的背景下更好.

伸缩架构原理也适用于大模型

32
谷歌的Griffin论文完美地展示了缩放定律。由于参数扩展了 7 倍,任务性能提高了大约 10%。全部都使用相同的 3000 亿代币数据进行训练。当您跨参数扩展时,模型会获得更高的样本效率或更好的推断.

10个最新开源大模型Llama 3应用

76
Llama 3改变了LLM游戏。人们在GPT-4水平上发现了开源用例,在开源社区中有一场大规模的运动。10个例子(以及使用Llama 3的方法):1.在Raspberry Pi 5上运行的Llama .

Meta开源Llama 3发布

38 1
Meta发布迄今为止最有能力的开源大模型:Llama 3 要点: 此次发布 Llama(Meta Llama 3)的前两个型号,可供广泛使用。此版本具有经过预训练和指令微调的语言模型,具有 8B 和 .