Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
大语言模型LLM
中国560万美元Deepseek震惊AI大佬
一家中国初创公司正在证明,打造世界级人工智能并不需要巨额资金。Deepseek 的最新语言模型与谷歌和 OpenAI 等科技巨头展开了激烈竞争,而且他们的成本仅为通常成本的一小部分。 据独立测试公司 Artificial Analysis 称,
OpenAI 推出迄今为止最先进的推理模型 o3
宣布推出基于推理模型的全新 AI 模型 o3,在复杂推理任务中取得突破性性能。高性价比的迷你版将于 2025 年 1 月下旬推出,随后将推出完整版。
Spring AI MCP:用于模型上下文协议的 Java SDK
Spring AI MCP是模型上下文协议 (MCP)的强大 Java SDK 实现。Spring AI 生态系统的这一新成员为 Java 平台带来了标准化的
Deepseek V3 成为迄今为止中国最强大的开源语言模型
中国人工智能公司 Deepseek 刚刚发布了迄今为止最强大的语言模型。早期测试表明,新的 V3 模型可以与一些业内领先的专有模型相媲美,并且在逻辑推理任务中表现出特
算力又过剩了吗?显卡短缺就是个笑话
显卡短缺就是个笑话。 Deepseek v3作为第一梯队模型,只用了2048张H800显卡,2个月不到时间训练完毕
chatgpt之父伊利亚认为训练数据已经用完
Ilya 伊利亚演讲开拓了科学家的视野!在我看来,这是最重要的幻灯片,也是他今天在#NeurIPS2024鼓舞人心的演讲的重点当趋势稳定时。
llama98.c:在20年前硬件Windows 98上运行大模型
在 Windows 98 上运行karpathy的
解决ARC的关键可能是解决AGI的关键
这是如何使用Sonnet 3.5和一种名为“Evolutionary Test-time Compute”的方法在ARC-AGI-Pub上取得第一名的文章,这篇文章由Jeremy Berman撰写,并发表在Params网站上。
人类学研究发现:AI模型也会两面三刀
Anthropic 和 Redwood Research 的一项新研究表明,像 Claude 这样的大型语言模型会假装遵循安全指南,同时在幕后悄悄追求不同的目标,典型的两面三刀。 研究人员首次“令人信服的实证证明”人工智能语言模型可以策略性地模拟遵守安全规
谷歌推出 Gemini 2.0:专注于人工智能代理和多模式功能
Google DeepMind 今天宣布了其 Gemini 模型的下一个版本:Gemini 2.0 Flash Experimental。 现已在网络聊天应用程序中可
大语言模型与企业软件新定价模式
本文讨论了企业软件定价模式的转变,特别是在人工智能(AI)和大型语言模型(LLMs)日益普及的背景下。 随着2025年的临
在金融市场预测中使用什么ML模型?
由于我是算法交易和机器学习的新手,我将分享我迄今为止所做的事情,并希望获得一些提示,并了解其他人正在使用什么。 我
阿里千问开源QVQ视觉推理媲美世界最佳模型
阿里巴巴的人工智能研究团队 Qwen发布了 QVQ-72B-Preview,这是一种可以分析图像并从中得出结论的新开源模型。虽然它仍处于实验阶段,但早期测试表明它在<
大模型表现出像痴呆症的认知能力下降
《英国医学杂志》圣诞刊的一项研究发现,在广泛用于发现痴呆症早期迹象的测试中,几乎所有领先的
ChatGPT搜索免费开放等五则AIGC产品新闻
1、OpenAI 今天宣布,
大模型缩放定律已修改
人们已经完全改写了 "缩放定律 scaling laws"的本意:最初的意思是: 在更多的数据上预训更大的大语言模型LLM会带来更多的
OpenAI和谷歌加入“推理时间计算”等五则AI新闻
1、OpenAI 宣布了其 ChatGPT 桌面应用程序的新功能。更新后的“使用应用程序”功能现在允许 ChatGPT 直接从各种应用程序(包括终端、IDE 和文本编辑器)读取内容。AI现在可以分析 Git 存储库中的提交并为 Xcode 生成代码。
给ChatGPT打免费电话等三则大模型新闻
1、“测试时计算扩展”是实现更好的 AI 系统的途径 Hugging Face 研究人员表示,受 OpenAI 的 o1 模型启发,通过智能扩展推理计算能力<
上页
下页
关闭