DeepSeek时刻 - 第8页

使用 8xRTX 4090 构建 GPU 服务器实现大模型本地部署和运行推理：Marco Mascorro 构建了一个非常酷的 8x4090 服务器用于本地推理，并编写了一个非常详细的操作指南，介绍了他使用了哪些部件以及如何将所有部件组合在一起。

这是Gemma 3 27b vs. 阿里千问QwQ 32b vs. Mistral 24b vs. Deepseek r1测试。上周，谷歌和Mistral公司分别发布了两个新的人工智能模型，叫做

本文来自一美国博文：我们需要一个美国版的深度求索（DeepSeek）。我们需要一个自主、开源的通用人工智能（AGI）巨头，而且现在就要。因为美国的前沿实验室正在输掉这场竞赛。不信？每出现一个美国的闭源或专有模型，我们就能看

中国人工智能实验室 DeepSeek 刚刚发布了其庞大的 DeepSeek v3 模型的最新版本，并将发布日期融入名称中DeepSeek-V3-0324。这是 DeepSeek v3 的更新版本，现在采用 MIT 许可证（以前是自定义的 Deep

Meta发布Llama 4家族的第一批智能模型，这些新工具能让人们打造更符合个人需求的文字+图片+视频的智能体验。最大特色是10M上下文，可以塞入整个代码库让其分析和重构理解。（

这可能是在消费硬件上运行 DeepSeek-V3 的最佳和最用户友好的方式，也可能是最实惠的方式。听起来你终于可以在家里本地运行 GPT-4o 级别的模型了，而且可能质量更好。 DeepSeek-V3 现在在 Mac Studio 上以每秒

我们最初提供的是Deepseek-v3-03241.58 位版本，您仍然可以使用，但其输出效果不是最好的。因此，我们发现有必要通过增加向下项目大小来升级到 1

乔尔·皮诺（Joëlle Pineau）是Meta公司搞人工智能研究的顶梁柱，在干了快八年后，她决定5月30号走人。她走的时候正好赶上公司内部战略大调整。皮诺是Meta最顶尖的AI研究员之一，从2023年开始领导公司的基础AI研究部门（FAIR）。在那里

谷歌认为自家Gemma 3是“世界上最好的单加速器模型”，在单个 GPU 上比 Facebook 的 Llama、DeepSeek和 OpenAI 的模型都强，而且在

本体管道（Ontology Pipeline）怎么帮AI系统更好地理解知识？现在要让AI和大语言模型表现好，必须给它们喂"有营养的知识"——就是那些整理得井井有条、带标签分类的知识库。但很多人对知识库有两种误解：

Llama 4 的新许可证带了好几个限制：如果你的公司每个月有超过7亿个活跃用户，你得向 Meta 申请一个特别许可证，Meta 可以自己决定给不给你。你得在网站、界面、文档这些地方显眼地写上“用 Llama 造的”。你用 Llama 的材料做的任

前谷歌中国区负责人李开复正在调整他的人工智能初创公司01.AI，全面采用Deepseek的开源模型，并认为这对OpenAI的商业模式构成了挑战。

低成本时Llama 4表现最佳，中等成本GPT-4o领先，高成本GPT-4.5 Preview最优。

LangManus 是一个社区驱动的 AI 自动化框架，它建立在开源社区的出色工作之上。我们的目标是将语言模型与专用工具结合起来，以完成网页搜索、抓取和 Python 代码执行等任务，同时回馈使这一目标成为可能的社区。演示

谷歌旗下的人工智能团队DeepMind最近"一直捂着自家厉害的研究成果不发"，就是为了在AI竞赛中不掉队。他们现在搞了个新规矩：凡是重要的AI研究论文，必须憋够六个月才能公开。 DeepMind有位研究员说了句大实话："要是搁现在，我们打死也不会把

2024年11月，美国管电的部门FERC对亚马逊说："不行！"原来亚马逊想从宾州一个核电站直接买电给自己数据中心用，这样能多买180兆瓦（够18万户家庭用）。但政府说这对其他用户不公平：这就像插队买奶茶，你爽了别人就得等更久。美国电不够用了？过去20年美

DeepSeek 的通用奖励模型（GRM）通过推理时缩放优化奖励信号，让本地大模型更高效：减少训练成本——动态调整计算量，避免冗余训练；提升泛化能力——适应多任务，无需反复微调；开源可商用——本地部署更灵活，降低依赖云端成本。</

盖茨说，未来十年，人工智能会变得超级厉害，厉害到世界上“大部分事情”都不需要人来做了。他在一个电视节目里跟一个喜剧演员说，现在很多事情还得靠人，比如厉害的医生、厉害的老师，因为这些专家比较少。但是，未