• 如今LLM 大语言模型遇到天花板,语言远不止表现不同词语之间的统计模式,以及根据提示生成这些模式这么简单。 另外,大多数攻读大模型的人都没有接受过正规的语言学培训,-如果你想让*语言模型*发挥作用,那么掌握一些关于*语言*如何运作的理论知识确实非常
  • DeepSeek 通过 r1 实现了令人难以置信的成就,这可能是自 GPT-4 以来最重要的 AI 发布:一个开源的、MIT 许可的推理模型,可与 OpenAI 的旗舰产品 o1 相媲美,这在几个月前是不可想象的。 DeepSeek 推理(测试时计 icon
  • Deepseek 是一家中国 AI 初创公司,其最新 R1 模型在多个推理基准测试中击败了 OpenAI 的 o1。尽管 Deepseek 低 icon
  • 人工智能发两个方向:GPU硬件和强化学习算法,这两个方向是条条大路通罗马还是南辕北辙? 首先,让我们了解一下强化学习算法代表DeepSeek DualPipe 算法,再谈谈英伟达的GPU硬件! 1 icon
  • 宣布推出基于推理模型的全新 AI 模型 o3,在复杂推理任务中取得突破性性能。高性价比的迷你版将于 2025 年 1 月下旬推出,随后将推出完整版。 icon
  • 今天很多人讨论,猜测OpenAI已经越过了临界点(“奇点”),AI开始自我迭代。 OpenAI可能已经'爆发',并最终越过了起飞的最后一个临界点:智能到递归自我改进的程度,o 4或o 5将能够自动化AI研发并完成其余部分。 像 icon
  • 杨立昆Yann LeCun 认为语言模型不能通往AGI,而维特根斯坦等哲学家早就基于语言指明了人类思想智能方向,既然此路不通,当然要仙人指路指出新的通往AGI icon
  • OpenAI的新模型名为GPT-4 b micro,经过训练,它能够提出增加蛋白质功能设计的新建议: 研究人员采纳了GPT-4 b micro模型的建议:改变了Yamanaka山中因子中的两个因子。 这个建议使得两个因子的效率提高了50倍以上! 由这两个因子重编程设计 icon
  • OpenAI 报告称其新的o3 推理模型取得了突破性进展。该公司将这一进步归功于强化学习,这是一种成熟的人工智能训练方法,在某些任务上具有显著优势,但在其他任务上具有 icon
  • AI智能三个发展规律:资源驱动、成本骤降、经济价值飙升。 OpenAI山姆奥特曼最近认为:工智能的规模定律将保持不变,“没有理由在不久的将来停止指数级增加投资”! 1. AI智能与资源的关 icon
  • 这是如何使用Sonnet 3.5和一种名为“Evolutionary Test-time Compute”的方法在ARC-AGI-Pub上取得第一名的文章,这篇文章由Jeremy Berman撰写,并发表在Params网站上。 icon
  • OpenAI 在 X 上宣布了一系列 12 场直播,展示“一系列大大小小的新事物”: 第一天要点: OpenAI 推出了 ChatGPT 的新高级版本,称为 ChatGPT Pro,它可以无限制地访问更强大 icon
  • 这几天,人们在X上讨论OpenAI是否已经达到了他们定义的AGI(人工通用智能)的第4级甚至更高。 AGI是指能够像人类一样思考和解决问题的AI。 OpenAI可能已经达到了第4级AGI,这意味着AI可以完成很多 icon
  • 一篇论文探讨了在大模型(LLM)中实现更高级推理能力的方法,特别是通过引入“元思维链”(Meta-CoT)框架来扩展旧的 icon
  • 人们已经完全改写了 "缩放定律 scaling laws"的本意:最初的意思是: 在更多的数据上预训更大的大语言模型LLM会带来更多的 icon
  • 以下是对 2024 年人工智能主要发展的简要看法: 1. 推理时间计算革命始于 OpenAI 的“ icon
  • OpenAI 今日公告摘要: - 引入 o1 的强化微调 (RFT) - 调整 o1 以学习在自定义域中以新的方式进行推理 - RFT 比常规微调更好、更有效; 生物化学、安全、法律和医疗保健是 OpenAI 研 icon