Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
本地小语言模型
OpenClaw v2026.4.26大清洗版本:插件重写性能提升、一键加密与迁移
这次更新最让人兴奋的地方在于:插件系统全面重写,1秒变43毫秒,265毫秒变8毫秒!无论是 Google Live Talk 的实时语音会话,还是 Cerebras 云服务的无缝接入,都体现了平台对“灵动”二字极致追求。用户不再被锁死在某一种模型或某一个服务商上,而是可以根据需求自由切换,甚
DeepSeek V4 Flash专用推理引擎ds4.c完全指南:本地跑大模型的新玩法
本文介绍ds4.c项目,一个专为DeepSeek V4 Flash模型设计的轻量级推理引擎。它采用Metal图形计算,支持超长上下文和磁盘KV缓存,强调端到端的本地运行体验。 这个引擎到底是啥
谷歌Chrome偷偷安装4GB AI模型:完整技术调查与法律后果 | 隐私专家独家披露
谷歌Chrome浏览器未经同意悄悄下载4GB的Gemini Nano AI模型到用户电脑。本文揭露下载流程、苹果系统日志证据、重复下载机制、环境碳排放(高达6万吨),以及违反欧盟隐私法的法律分析。 你家浏览器背着你下载了4GB垃圾:谷歌Chrome
OpenClaw v2026.4.27:DeepInfra模型自动路由、文件附件升级、元宝QQBot接入
在五个维度全面升级:DeepInfra正式入伙带来新玩法,文件附件更智能,代理路由更安全,本地模型修复大胜利,网关会话稳如狗,带你秒懂技术升级背后的真实逻辑与使用体验。 智能体大脑来了新供应商DeepInfra
Open Generative AI免费开源无审查AI工作室 | 替代Higgsfield和Krea的最佳选择
Open Generative AI 是一个完全免费、开源、无审查的AI图像和视频生成平台,提供200多个模型,无需订阅,所有创作成果归用户所有,可完全本地运行。 你不需要每个月花8到49美元去买那些AI会员,也不需要让你的创作被别人的服务器和内容
M4 MacBook Air上玩转OpenClaw+本地Gemma 4经验分享
不联网不付费不烫腿!M4 Air跑Gemma 4本地推理,本地AI终于对普通人说了句“你好”!我花了一个下午让Gemma 4跑在我的M4 MacBook Air上,全程没碰任何API密钥,那种“普通人也玩得转本地AI”的感觉终于来了 Red
M4芯片24GB内存跑本地模型:从装不上到每秒40token的踩坑实录
我花了三天让M4笔记本自己跟自己聊天,结果它把我的代码搞砸了!在苹果M4芯片24GB内存的MacBook上运行本地大模型的全流程实战。从选工具踩坑到调参数翻车,最终搞定Qwen模型实现每秒40个token,附赠真实翻车案例和配置文件。
本地多模态拳王Gemma 4 12B评测 | 无编码器架构详解
120亿个聪明脑细胞:为什么Gemma 4 12B是小模型里的拳王。 Gemma 4 12B深度解析:谷歌如何把多模态AI塞进你的笔记本电脑? 想搞懂谷歌新出的这个叫Ge
本地开源千问+Hermes搭建生产力环境完整教程指南
本地AI搭建完整指南:从选模型到自动整理文件!因为选对模型、学会写清晰指令并用代理自动执行,本地AI能变成替你24小时干活的免费数字员工,让生活更省力更有趣。 因为用对方法和模型,本地AI能变成替你干活的免费数字员工。
KVarN:华为用于KVCache量化的原生vLLM后端
华为开源KV Cache量化技术让大模型上下文提升5倍! KVarN(Variance-Normalized KV-Cache Quantization)是华为计算系统实验室(HUAWEI Computing Systems Lab)刚刚开源的一套
Google Gemma 4 QAT量化压缩解析:手机上跑本地模型
你手机里的超级大脑:Gemma 4 QAT模型让1GB跑AI成为现实!告别云端:本地AI时代来临,Gemma 4 QAT详解! 2026年最值得玩的本地模型:Google Gemma 4 QAT上手体验:量化感知训练是什么?普通人也能看懂的AI压缩
小模型也发现了Mythos发现的漏洞:系统比模型更重要,能力呈锯齿状!
Anthropic黑客神话破灭!别迷信大模型,会搭系统才是真赢家!AI安全能力像锯齿不稳定,小模型常反杀大模型。真正护城河是编排模型的系统,不是模型本身。 护城河在系统,不在模型,能力呈现锯齿状分布
告别云端大模型:本地模型才是应用软件的靠谱未来 |
你的手机本就足够聪明,别再傻等服务器了!本文批判开发者盲目依赖云端AI接口,指出这会导致软件脆弱、侵犯隐私。作者通过自己开发的新闻应用实例,展示了如何利用苹果设备内置模型实现本地文本摘要,强调多数功能无需云端,本地处理更快更安全,并提供了具体代码和结构化的输出方法。
OpenAI悄悄丢出隐私小模型:这套流程让大模型彻底看不见你的秘密
用小模型先切掉隐私再交给大模型处理,从结构上锁死数据泄露,让AI根本没机会乱来。 几天前,OpenAI 在 Hugging Face 上悄然发布了一个名为 privacy-filter 的小型模型。为了更好地理解这个模型,作者使用 privacy-
谷歌发布本地模型DiffusionGemma:打字员变快4倍印刷机!
DiffusionGemma:谷歌全新扩散模型实现4倍速文本生成,本地推理的GPU瓶颈突破!别逐字等待:扩散模型如何让本地AI跑出法拉利速度! 谷歌发布实验性开源模型DiffusionGemma,采用文本扩散技术,在本地GPU上实现高达4倍于传统自
一千台599美元Mac mini替代H100跑大模型:便宜十倍
Uber 34亿美金烧出的教训:你的本地Mac已经是顶级AI服务器!买一千台Mac mini跑AI比租云服务器便宜十倍 Daniel Chen用1000台Mac mini替代H100;技术关键:统一内存架构、内存带宽120GB/s;对比维度:功耗10-
GPT Realtime 2.0实时语音模型17个创业方向
GPT Realtime 2.0是第一个能一边听你说、一边思考、一边查资料、一边做决定的真·实时智能体。以前所有语音 AI 都卡在“智商不够”,所以只能回个天气设个闹钟。现在智商一上来,17 个以前根本跑不通的创业点子就全活了。 你想一下啊,以前的语音 A
为什么谷歌Gemma 12B写东西比GPT-5更像真人?小模型的逆袭
从Gmail里长出来的AI:Gemma如何成为最会聊天的模型!AI说话太塑料?试试谷歌这个小模型,像朋友一样聊天 谷歌Gemma模型凭借Gmail等私有数据训练,在自然语言生成上超越大参数模型。本文用生活化案例解析小模型为何更“像人”,并给出选型指
下页