大语言模型LLM - 第21页

一家中国初创公司正在证明，打造世界级人工智能并不需要巨额资金。Deepseek 的最新语言模型与谷歌和 OpenAI 等科技巨头展开了激烈竞争，而且他们的成本仅为通常成本的一小部分。据独立测试公司 Artificial Analysis 称，

宣布推出基于推理模型的全新 AI 模型 o3，在复杂推理任务中取得突破性性能。高性价比的迷你版将于 2025 年 1 月下旬推出，随后将推出完整版。

Spring AI MCP是模型上下文协议 (MCP)的强大 Java SDK 实现。Spring AI 生态系统的这一新成员为 Java 平台带来了标准化的

中国人工智能公司 Deepseek 刚刚发布了迄今为止最强大的语言模型。早期测试表明，新的 V3 模型可以与一些业内领先的专有模型相媲美，并且在逻辑推理任务中表现出特

显卡短缺就是个笑话。 Deepseek v3作为第一梯队模型，只用了2048张H800显卡，2个月不到时间训练完毕

Ilya 伊利亚演讲开拓了科学家的视野！在我看来，这是最重要的幻灯片，也是他今天在#NeurIPS2024鼓舞人心的演讲的重点当趋势稳定时。

在 Windows 98 上运行karpathy的

这是如何使用Sonnet 3.5和一种名为“Evolutionary Test-time Compute”的方法在ARC-AGI-Pub上取得第一名的文章，这篇文章由Jeremy Berman撰写，并发表在Params网站上。

Anthropic 和 Redwood Research 的一项新研究表明，像 Claude 这样的大型语言模型会假装遵循安全指南，同时在幕后悄悄追求不同的目标，典型的两面三刀。研究人员首次“令人信服的实证证明”人工智能语言模型可以策略性地模拟遵守安全规

Google DeepMind 今天宣布了其 Gemini 模型的下一个版本：Gemini 2.0 Flash Experimental。现已在网络聊天应用程序中可

本文讨论了企业软件定价模式的转变，特别是在人工智能（AI）和大型语言模型（LLMs）日益普及的背景下。随着2025年的临

由于我是算法交易和机器学习的新手，我将分享我迄今为止所做的事情，并希望获得一些提示，并了解其他人正在使用什么。我

阿里巴巴的人工智能研究团队 Qwen发布了 QVQ-72B-Preview，这是一种可以分析图像并从中得出结论的新开源模型。虽然它仍处于实验阶段，但早期测试表明它在<

《英国医学杂志》圣诞刊的一项研究发现，在广泛用于发现痴呆症早期迹象的测试中，几乎所有领先的

1、OpenAI 今天宣布，

人们已经完全改写了 "缩放定律 scaling laws"的本意：最初的意思是：在更多的数据上预训更大的大语言模型LLM会带来更多的

1、OpenAI 宣布了其 ChatGPT 桌面应用程序的新功能。更新后的“使用应用程序”功能现在允许 ChatGPT 直接从各种应用程序（包括终端、IDE 和文本编辑器）读取内容。AI现在可以分析 Git 存储库中的提交并为 Xcode 生成代码。

1、“测试时计算扩展”是实现更好的 AI 系统的途径 Hugging Face 研究人员表示，受 OpenAI 的 o1 模型启发，通过智能扩展推理计算能力<