• 昨天,人工智能领域发生了一些事情:杨立昆领导的Meta 生成式人工智能部门(Meta genai org)陷入了恐慌模式。 杨立昆是 Meta(原 Facebook)的首席人工智能科学家,同时也是纽约大学的教授。杨立昆因其在深度学习领域的开创性工作
  • DeepSeek-R1来了!性能与OpenAI-o 1相当,便宜30倍,甚至在几乎所有的基准测试中都优于Claude 3.5 Sonnet和o 1-mini!MIT许可:Distill免费商业化!网站API现已上线!DeepThink就在今天已经开放:http://chat.
  • DeepSeek之所以能如此迅速地击败其他公司,是因为他们都是宽客。背后是量化幻方,专门从事A股量化投资的公司,他们天生就能优化了大规模ML的亚纳秒延迟。有一 icon
  • DeepSeek-R1:是如何让 OpenAI 级别的推理模型如此高效的? 最近我们都看到了关于 DeepSeek-R1 的讨论。它取得了一些惊人的成绩,在推理任务中经常匹敌甚至超过 OpenAI 的 o1 系列……而且它只用一小部分参数和低得多的成本就做 icon
  • 忘记 TikTok:美国可能需要禁止 DeepSeek-V3! Scale AI 公司的老板 Alexandr Wang 说,过去十年里,美国在人工智能(AI)比赛里可能一直比中国厉害,但到了圣诞节那天,情况变了。他的公司给 OpenAI、谷歌这些大 AI icon
  • 最近中国AI创业公司深度求索(DeepSeek)火了,他们搞的DeepSeek 3模型用更少的电脑算力就达到了和OpenAI差不多的水平,还省了好多钱。这下子好多投资人慌了,担心这会影响英伟达(NVIDIA)卖高端显卡的生意——毕竟现在训练AI都得用他们的顶级显卡。 icon
  • DeepSeek就像打破了“四分钟跑一英里”的纪录一样,做了一件大家以前觉得不可能的事。突然之间,语言模型通过“RL强化学习”变得超级厉害,而且它的规模很小,小到一个博士生几天就能重新做出来,如下,今年肯定会很疯狂! 我们在CountDown游戏里 icon