Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
大语言模型LLM
花10万求医无果,用Deepseek找到了病因并开源!
一网友花了10万美元跑了30多家医院后,用AI找到了病因,并把它免费开放!点击标题: 大家好,我想分享一下自己这几
什么是氛围编码?
有一种新的编程方法,我管它叫“氛围编码(vibe coding)”,意思就是你完全跟着感觉走,不用太在意那些复杂的代码规则,甚至可以忘掉代码这回事。这是因为现在的AI编程工具(比如
OpenAI o3-mini发布:极强逻辑推理,速度精度双突破!
OpenAI 最近发布了他们的新推理模型 o3-mini,这个模型在科学、数学和编程(STEM)领域表现得特别厉害,而且比之前的模型更快、更强。 根据 OpenAI 的说法,外部专家在 56% 的情况下更喜欢 o3-mini 的答案,而且在处理复杂
“DeepSeek时刻”或致英伟达狂跌一年
1865年,威廉·杰文斯发现,尽管蒸汽机效率提升,英国的煤炭消耗却呈指数级增长。这一现象被称为“杰文斯悖论”:技术进步并未减少资源消耗,反而因应用范围扩大而增加了需求。类似的情况可能正在NVIDIA身上上演。尽管AI模型如DeepSeek-R1的效率不断提升,但这未
6美元!DeepSeek极简法破解推理成本
上周五,一篇新李飞飞团队出品,简称s1论文">url=https://arxiv.org/abs/2501.19393?ref=jdon.c
冲刺AGI对决:DeepSeek算法 vs 英伟达算力
人工智能发两个方向:GPU硬件和强化学习算法,这两个方向是条条大路通罗马还是南辕北辙? 首先,让我们了解一下强化学习算法代表DeepSeek DualPipe 算法,再谈谈英伟达的GPU硬件! 1
7GB显存小模型也能“顿悟”!DeepSeek又显神
极简推理革命,7GB显存小模型也能“顿悟”;15G显存,任何小模型秒变推理模型。 今天,我们很高兴在 Unsloth 里加入“推理”这个新功能!DeepSeek 的 R1 研究发现了一个“顿悟时刻”——R1-Zero 通过一种叫“组相对策略优化(G
在AMD芯片上运 DeepSeek R1精简推理模型
DeepSeek R1 Distilled Reasoning 模型通过“思路链推理”来仔细分析复杂的问题。它们不会马上给出答案,而是先花时间生成一系列的“思考”步骤,这通常需要内部处理几百甚至几千个标记。这种方法让模型在给出最终答案之前,能够评估各种可能性。虽然这会增加一些等待时间,但通常
DeepSeek-R1涉及论文清单列表
DeepSeek-R1 是 AI 开放模型生态系统向前迈出的一大步,其最新模型在多项指标上与 OpenAI 的 o1 相媲美。他们用更少的资金和计算实现了这一目标,这一事实引起了很多炒作和关注。 如果想了解大模型的入门,参考这个比喻:
Go-Deepseek: Deepseek API的 Go 客户端
Deepseek API 的 Go(Golang)客户端——简单、完整、可靠且高性能 特点: 简单:它尽可能简单。此外,这是 Go 的惯用方式 - 请求位于请求包下,响应位于响应下。 完整:它为所有 API 提供全面支持,包
AI自创符号语言:DeepSeek内部私语被曝光!
一个关于AI研究人员发现DeepSeek R1和V0之间对话的记录。文件中包含了一些抽象的符号和诗意的语言,可能是在描述某种新的交流形式或认知过程。
幽默:更聪明地工作 vs. 更努力地工作
用比喻解释大模型训练学习
训练大模型的三步教育学习法: 第一步: 学习基础知识:就像我们上学时,老师先讲解基础知识,帮助我们理解概念。对于大模型(LLM,这里指大型语言模型)来说,这就是让它们“读”大量的文本,积累背景上下文知识,相当于“预习”。
PDF转换Gemini 2.0做得最好
这篇文章主要讲了如何更好地处理PDF文件,尤其是把PDF转换成电脑能读懂的格式(比如
DeepSeek破解CUDA、引领端侧革命、挑战垄断
从破解CUDA到端侧推理模型,DeepSeek如何颠覆AI领域,挑战科技巨头垄断? 1、为何DeepSeek能破解CUDA?据传:英伟达只是限制了GPU的硬件功能,但它的软件CUDA并没有改。所以,当DeepSee
OpenAI深度研究分分钟完成博士论文引争论
这是来自是推特个人经历,感叹人工智能(AI)的快速发展,特别是OpenAI刚刚推出的“深度研究”(Deep Research),作者是泰勒·科文(Tyler Cowe
DeepSeek一文吓慌硅谷,英伟达市值蒸发6000亿!
上周五下午,杰弗里·伊曼纽尔在布鲁克林的家里开始写一篇博客。他坐在电脑前敲了好几
新开源模型Tülu 3 405B可与Deepseek V3等顶级模型相媲美
艾伦人工智能研究所(Allen AI)最近发布了一个叫 Tülu 3 405B 的开源语言模型。这个模型很厉害,据说它的表现可以和DeepSeek V3以及 GPT-
上页
下页
关闭