Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
大语言模型LLM
廉颇老矣,AI教父杨立昆掉在认知陷阱里出不来了
AI教父杨立昆(Yann LeCun)最近在访谈中说:我们无法仅通过扩大 LLM 规模就获得人类水平的人工智能。他一直多次唱空语言模型,这次是否猜中了,还是类似上海爷叔对股市的预测? 在完整的播客里,他解释说,他认为“推理”是建立在 LLM(大型语
用第一性原理引导AI思路:跳出模式匹配局限
在使用大模型时,应该从第一性原理(First Principles)思考,而不是依赖过去的模式匹配,可以帮助我们更好地预见和应对未来的变化。这种方法强调从最基本的原理出发,重新构建对问题的理解,而不是简单地依赖过去的经验或现有的框架。 以下是对这一观点的详
氛围感编程的12条黄金法则
在使用大模型自动生成代码时需要注意的12大陷阱,可作为AI自动编程和Vibe编程的最佳实践,将氛围感拉满: 1、你要停止挖掘现在的AI模型在遇到问题时,不太懂得停下来思考。比如说,你想做一个功能X,但在做的过程中发
Gemma、Mistral、QwQ挑战Deepseek,谁能胜出?
这是Gemma 3 27b vs. 阿里千问QwQ 32b vs. Mistral 24b vs. Deepseek r1测试。 上周,谷歌和Mistral公司分别发布了两个新的人工智能模型,叫做
DeepSeek V3升级版:M3每秒20个token
中国人工智能实验室 DeepSeek 刚刚发布了其庞大的 DeepSeek v3 模型的最新版本,并将发布日期融入名称中DeepSeek-V3-0324。 这是 DeepSeek v3 的更新版本,现在采用 MIT 许可证(以前是自定义的 Deep
M4 Max跑大模型?慢得离谱
网友分享:我用的是苹果顶配笔记本M1 Max芯片,最近换成了最新的M4 Max——速度确实快了不少(大概有3倍提升),但还是远远比不上5年前卖700美元的NVIDIA显卡RTX 3090。 虽然这台电脑能勉强运行大模型,但实际体验很差。举个例子:连最小的1
低耗高能!DeepSeek-V3 4bit 20tk/s仅200w
这可能是在消费硬件上运行 DeepSeek-V3 的最佳和最用户友好的方式,也可能是最实惠的方式。听起来你终于可以在家里本地运行 GPT-4o 级别的模型了,而且可能质量更好。 DeepSeek-V3 现在在 Mac Studio 上以每秒
Crane:类似llama.cpp实现本地运行模型
基于纯 Rust 的 LLM 推理引擎,由 Candle 框架提供支持。 Crane 专注于利用 candle 框架中内核的强大功能来加速 LLM 推理速度,同时减少开发开销,使其在 CPU 和 GPU 上都具有可移植性和快速运行模型。 <
睡不好觉,李开复全面拥抱Deepseek
前谷歌中国区负责人李开复正在调整他的人工智能初创公司01.AI,全面采用Deepseek的开源模型,并认为这对OpenAI的商业模式构成了挑战。
大语言模型运作机制7个发现
以前我们对大语言模型(LLM)到底怎么运作几乎一无所知...直到现在。 AnthropicAI刚刚发布了一份超级震撼的研究论文,详细揭示了AI"思考"的某些方式。结果完全颠覆了我们的认知!
谷歌Gemma 3:单GPU性能超DeepSeek
谷歌认为自家Gemma 3是“世界上最好的单加速器模型”,在单个 GPU 上比 Facebook 的 Llama、DeepSeek和 OpenAI 的模型都强,而且在
OpenAI不再黑箱,权重全公开!
奥特曼说OpenAI今年夏天要发布一个叫"Open Weight"的AI模型 - 这是本周的大新闻。谁能用简单的话说说这是啥?Deep Seek已经有类似的东西了吗? 想象每个单词都对应一个数字,这些数字之间互相关联,就像朋友关系链,
llama4发布之前,Meta AI主管离职!
乔尔·皮诺(Joëlle Pineau)是Meta公司搞人工智能研究的顶梁柱,在干了快八年后,她决定5月30号走人。她走的时候正好赶上公司内部战略大调整。 皮诺是Meta最顶尖的AI研究员之一,从2023年开始领导公司的基础AI研究部门(FAIR)。在那里
大语言模型揭示自闭症真相
科学家通过大语言模型发现自闭症真正特点:重复做同一件事和特别喜欢与感觉有关某一样东西(比如总是喜欢画画、喜欢弹钢琴),这些特点比不擅长跟人打交道更能说明一个人可能有自闭症。以往人们误区以为自闭症是一个情商不高,不喜欢与人打交道,才有自闭倾向,现在,通过大语言
宫崎骏文生图爆火!ChatGPT算力告急
因为用的人太多,OpenAI 现在暂时不让新用户玩 Sora 视频生成功能了。这事儿发生的时候,他们正忙着应付大家疯抢新出的 GPT-4o 图片功能——之前有个叫 Ghibli 的功能太火爆,直接把他们的显卡算力给榨干了。不过新用户还是能正常玩图片生成,只是视频功能
你提问题的习惯,实际在强化你的偏见
人们上网时只爱看自己想看的东西,就像刷短视频只点赞自己喜欢的,对反对意见直接划走。 本来搜索引擎能治这个毛病,把靠谱的答案排前面,让大家多看到真相。 但现实是两重暴击: 第一,骗子网站会钻
2025第一季AI爆发:17个模型4个冠军
我们已经进入 2025 年 3 个月了……随着 Deepseek V3 新品和 Gemini 2.0 pro 实验版 03-25 的发布,今年迄今为止至少已发布了 17 个主要模型,其中 4 个模型在各种指标/基准/分析中独立占据了 SOTA 位置。 在这
在Docker中将能运行本地AI模型
Docker Model Runner 通过消除复杂设置、处理依赖项和优化硬件,使运行大模型 LLM 变得毫不费力 为基于云的推理提供安全、低延迟的替代方案,所有这些都无缝集成到 Docker Desktop 中。 直接从 Dock
上页
下页
关闭