Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
DeepSeek时刻
杨立昆退休?中国Deepseek超Llama 4触发Meta内部恐慌
昨天,人工智能领域发生了一些事情:杨立昆领导的Meta 生成式人工智能部门(Meta genai org)陷入了恐慌模式。 杨立昆是 Meta(原 Facebook)的首席人工智能科学家,同时也是纽约大学的教授。杨立昆因其在深度学习领域的开创性工作
中国大模型DeepSeek-R1性能与OpenAI-o1不相上下
DeepSeek-R1来了!性能与OpenAI-o 1相当,便宜30倍,甚至在几乎所有的基准测试中都优于Claude 3.5 Sonnet和o 1-mini!MIT许可:Distill免费商业化!网站API现已上线!DeepThink就在今天已经开放:http://chat.
DeepSeek成功背后是宽客精神
DeepSeek之所以能如此迅速地击败其他公司,是因为他们都是宽客。背后是量化幻方,专门从事A股量化投资的公司,他们天生就能优化了大规模ML的亚纳秒延迟。有一
DeepSeek-R1如何用极简参数实现OpenAI级推理?
DeepSeek-R1:是如何让 OpenAI 级别的推理模型如此高效的? 最近我们都看到了关于 DeepSeek-R1 的讨论。它取得了一些惊人的成绩,在推理任务中经常匹敌甚至超过 OpenAI 的 o1 系列……而且它只用一小部分参数和低得多的成本就做
下一个TikTok,美国可能会封禁DeepSeek!
忘记 TikTok:美国可能需要禁止 DeepSeek-V3! Scale AI 公司的老板 Alexandr Wang 说,过去十年里,美国在人工智能(AI)比赛里可能一直比中国厉害,但到了圣诞节那天,情况变了。他的公司给 OpenAI、谷歌这些大 AI
DeepSeek不是英伟达的终结者
最近中国AI创业公司深度求索(DeepSeek)火了,他们搞的DeepSeek 3模型用更少的电脑算力就达到了和OpenAI差不多的水平,还省了好多钱。这下子好多投资人慌了,担心这会影响英伟达(NVIDIA)卖高端显卡的生意——毕竟现在训练AI都得用他们的顶级显卡。
DeepSeek强化学习被复制成功
DeepSeek就像打破了“四分钟跑一英里”的纪录一样,做了一件大家以前觉得不可能的事。突然之间,语言模型通过“RL强化学习”变得超级厉害,而且它的规模很小,小到一个博士生几天就能重新做出来,如下,今年肯定会很疯狂! 我们在CountDown游戏里
上页
关闭