Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
大语言模型LLM
谷歌八子创AI革命核心,却与诺贝尔奖无缘!
8名Google员工发明了现代AI核心Transformer,这里是内幕:一群谷歌的怪咖,靠着脑洞和咖啡,搞出了个能“变形”的超级AI,改变了世界! 2016年的某一天,谷歌的咖啡馆里热闹得像个集市。Jakob Uszkoreit正跟一个叫Illi
Claude 4和Gemini 2.5 Pro比较
我最近一直在同时使用 Claude 4 和 Gemini 2.5 Pro,主要用于写作、编码和解决一般问题,并决定写一篇完整的比较报告。 以下是我过去几天测试后发现的要点: Claude 4 的
谷歌Gemma 3n实现手机端AI流畅运行
最新消息!谷歌大叔刚刚在HuggingFace这个"程序员菜市场"挂出了Gemma 3的"试吃装"(预览版),看样子是专门给智能手表、智能家居这些"边缘设备"准备的。不过现在只能看宣传单(文件未发布),真正的"零食大礼包"还得再等等! 它有个独门绝
Deepseek王者归来:世界第四大智能AI
DeepSeek R1型号进行了小版本升级,当前版本为DeepSeek-R1-0528。 改进基准性能增强的前端功能减少幻觉支持JSON输出&函数调用 在最新的更新中,DeepSeek R1通过利用增加的计算资源和在
Meta炸锅!Llama4团队八成跑光?
听说Meta的llama4团队有80%的人辞职了
强化学习:AI推理游戏的颠覆性突破引擎
强化学习正在改变一切,从人工智能的思维方式到科技巨头数十亿美元的基础设施:AI基础设施瓶颈与变革、蒸馏、数据是护城河、递归式自我提升、o4 和 o5 强化学习训练! Semianalysis写了一篇很长的文章,解释了为什么模型可以突然连贯地工作很长
苹果AI傲慢与偏见:语言模型根本不会思考
苹果并不认为推理模型是标准LLM的重大突破--新研究原因如下: 在其最新的研究报告《思考的错觉》中,苹果质疑了一个普遍的假设,即大型语言模型已经能够进行真实的逻辑思考,即真实的“推理”。苹果公司的研究人员看到的不是认知上的突破,而是一种错觉:这些模
企业定制AI:18步搞定本地模型微调实战
手把手教你玩转AI模型微调!零基础也能秒懂 什么是微调?(给模型开小灶)想象GPT-4是个全能学霸,但OpenAI给它开了"家教课"专门练对话,这才有了我们现在用的ChatGPT!就像: 你
手工微调大模型浪费时间,AI智商翻倍有三招
最近有个投资人非要拉我帮忙调查家创业公司,你猜怎么着?他们居然觉得靠"微调"就能让AI系统自动更新知识!好家伙,这还有人相信微调是万能仙丹呢? 来咱们掰扯掰扯。现在好多人都把微调大模型当成给手机充电——插上数据线就能往AI脑子里灌新知识?大错特错!
Gemini 2.5 Pro更新版本碾压Claude4
最新的Gemini 2.5 Pro更新现已进入预览版。它在编码、推理、科学+数学方面更出色,在关键基准测试(AIDER Polyglot、GPQA、HLE等)中表现出更好的性能,并领先于上一个版本,Elo得分跃升了24分! Gemini 2.5 Pro在三
为啥DeepSeek-V3本地跑这么费劲?
为啥 DeepSeek-V3 模型在云上服务时又快又便宜,但你自己在家用电脑跑的时候却又慢又贵? 想象一下,你去吃自助餐。餐厅里有个超级大厨(就像GPU,电脑的“计算大脑”),他炒菜超快,但有个毛病:他懒得炒一小份菜。给他一堆食材,他能“唰唰唰”一
AI宫斗:Anthropic切断编程神器Windsurf调用
听说了吗?AI圈子里最近炸开了锅!Anthropic这家公司,原本跟Windsurf关系还不错,结果突然翻脸,把Windsurf能用的Claude模型(这可是Anthropic的宝贝AI)给掐了!为啥?因为有小道消息说,OpenAI要花30亿美金把Windsurf给买下来!这消息一出,Anthrop
DeepSeek新版R1口味从Chatgpt换成Gemini
给AI模型做"DNA亲子鉴定"!文本风格分析显示,新版R1现在更接近Google。所以他们可能使用了更多的合成双子输出进行训练。 想象每个AI模型都会在作文里留下自己的"口水印"——老版的r1家族用的是OpenAI牌的"口水",新版的r1家
奥特曼力荐O3-Pro性能超群!O3价格跳水80%
o3-pro现在面向所有chatgpt pro用户和API推出。 奥特曼说: 它真的很聪明!我第一次看到他们的时候,我不相信相对于o3的胜率。 我们把o3的价格降了80%!!很期待看到人们会用它来做什么 我想你也会对O3-P
大模型评估三法宝:智能检索+01评估+专家标注
AI圈炸锅了!"RAG已死"是标题党还是真凉了? 问:RAG这技术是不是凉透了?问:网上都在传"RAG已死",那我做AI应用是不是该躲着RAG走? 最近好多程序员
Claude 4发布:全球首款防生化核弹举报AI
Claude AI双胞胎兄弟震撼出道!这次连造原子弹的坏蛋都防得住! AI界又搞大事情啦!Anthropic公司刚刚甩出王炸——Claude Opus 4和Claude Sonnet 4两兄弟闪亮登场!这俩可不是普通AI,人家自带"防暴盾牌",连制造生化武
Gemini奥赛吊打OpenAI!差距大到离谱
大模型真不懂语义?通过语境吐出下一个词!
作为意义的创造者,我们使用口语或手语来理解我们在周围世界中的体验。像ChatGPT(使用大型语言模型)这样的生成式人工智能的出现,对如何定义“意义”这一概念本身提出了质疑。 人工智能工具的一个常见特征是它们“理解”自己在做什么。
上页
下页