Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
AI基础设施
OpenClaw可视化控制台:监督智能体群的工作进度
openclaw-mission-control是一个开源的OpenClaw 编排与监控仪表盘,专注于与 OpenClaw 多智能体协同系统集成。它帮助用户实时管理、组织、追踪各个 OpenClaw 智能体的任务与状态,让你有一个可视化的“控制台”来监督智能体群的工作进度。<
Taalas硬编码芯片打爆英伟达H200:无HBM却快10倍省20倍钱
当整个行业都在烧钱建数据中心、囤GPU、搞液冷超算时,一家成立仅两年半的加拿大公司Taalas掏出了一块"硬编码"芯片,把Llama 3.1 8B模型的推理速度干到了每秒17000个token——比英伟达H200快将近10倍,成本只有二十分之一,功耗少了90%。他们没有HBM,没有先进封装,
智能体CLI命令行比MCP节省下94%Token成本!
AI智能体正面临隐形成本危机,MCP协议因冗余的JSON Schema导致Token浪费。用CLI命令行技术实现94%的成本削减,并深度解析CLIHub工具的革命性优势。 现在的AI智能体,特别是那些用MCP(Model Context Proto
OpenClaw企业级服务完全指南:月入百万的部署生意
OpenClaw代表着自动化领域的iPhone时刻降临,线性自动化正在让位于自主智能代理。 高价值机会藏在企业级部署服务里:单次实施收费1到2万美元,月度维护费2到5千美元。法律、私募股权、医疗等合规敏感行业急需本地化AI解决方案,而大多数企业卡在第二天就
中国AI春节档七连发:开源低价智能体成行业新标配
2026年开年三周,七大中国AI实验室密集发布前沿模型,MoE架构、开源权重、Agent能力成为共同标签,定价仅为西方竞品十分之一,国产芯片与自主可控战略取得突破性进展。 中国AI春节档七连发:DeepSeek去年炸场引发万亿市值蒸发,今年
AMD ROCm 7.11.0预览版解析:TheRock模块化架构革命重塑GPU编程生态
AMD发布ROCm 7.11.0技术预览版,采用全新TheRock构建系统实现模块化架构,支持从数据中心到边缘设备的统一GPU编程体验,开源生态涵盖PyTorch、Kubernetes等主流框架,为AI开发者提供低成本高灵活性的CUDA替代方案。
DeepSeek DualPath榨干存储带宽:推理吞吐暴力翻倍!
北大清华和DeepSeek团队发现Agentic LLM推理卡在存储带宽上,GPU闲得发慌网卡累成狗。他们搞了个DualPath双路径加载机制,让闲着的那半边网卡也干活,结果吞吐量翻倍,延迟还稳得像老干部喝茶。 现在的智能体那是真智能,自己会调工具
谷歌首次大规模部署铁空气储能系统
谷歌数据中心搞了个铁-空气电池,这个超级充电宝能撑四天四夜不断电 这个事情要从美国明尼苏达州说起。有一家叫Form Energy的创业公司,他们研发了一种新型电池,是用铁和空气来储存电的,专门用来存太阳能、风能这些清洁能源,而且存的时间比我们现在常
两大主流引擎vLLM与TensorRT-LLM在5000亿参数推理中对决
深度对比vLLM与TensorRT-LLM在5000亿参数模型上的实测表现,揭示性能优势背后的运维代价,提供生产部署决策框架。 AI推理界的"华山论剑"——vLLM和TensorRT-LLM到底谁才是5000亿参数大模型的真命天子? vLL
Cloudflare自动将HTML转为Markdown供AI代理抓取,节省80%token成本!
Cloudflare新功能自动将HTML转为Markdown供AI代理抓取,节省80%token成本,标志着互联网从搜索引擎时代迈入AI代理时代,内容创作者需重新思考网站架构。 过去二十年,网站拼命讨好谷歌爬虫,SEO优化成了流量密码。现在AI代理
磷化铟InP:AI光通信供应链里的隐藏大魔王
磷化铟是AI数据中心光通信的不可替代材料,中国铟出口管制加剧供应链风险,全球150毫米产能稀缺,A股铟资源与光通信器件公司面临战略重估机遇。 叫磷化铟,英文叫Indium Phosphide,简称InP。这玩意儿听起来像是化学课上的噩梦,实际上却是
5亿造SRAM+HBM推理芯片:MatX成本革命直击英伟达命门!
AI芯片战场迎来新玩家,MatX用5亿美元押注能同时驾驭高速缓存SRAM与大容量内存HBM的终极方案,目标直指英伟达霸主地位。 想象一下你在玩游戏。电脑里其实有两个存东西的地方:第一个在CPU旁边,叫“口袋”SRAM。它的速度飞快,你伸手就
光子学:AI基础设施的神经中枢与七层掘金地图
光子学是AI基础设施的神经中枢。随着模型规模爆炸,光互连取代铜缆成为刚需,七层产业链从磷化铟衬底到光模块正经历结构性短缺,利润向上游材料与测试环节迁移。 光子学正在从幕后走向台前,成为AI基础设施中最关键的物理瓶颈。当英伟达(Nvidia)的GPU和AMD
光子霸主之争:Lumentum为何市值反超Coherent并领跑AI光模块市场
激光界的“神仙打架”:Lumentum如何靠硬核物理把对手按在地上摩擦。本文以幽默脱口秀形式解析AI时代光模块激战,揭秘Lumentum如何靠技术壁垒与Coherent拉开差距,以及测试设备Keysight透露的真实需求。 最近科技新闻里总出现两个
AI基建瓶颈接力赛全解析:从GPU算力到电力荒八大关卡
深度拆解AI时代半导体行业八大瓶颈关卡,从CPU到GPU转型、内存墙、HBM短缺、先进封装、电力荒到光通信,带你看清算力扩张背后的硬核技术博弈与投资机会。 算力中心半导体瓶颈接力赛:AI时代生存必修课 AI这玩
大模型KV缓存五倍速秘诀:首字延迟背后内存瓶颈
大语言模型生成文本时存在明显的"首字延迟"现象,这源于KV缓存机制的工程权衡。该技术KV Caching通过存储先前计算的键值向量避免重复计算,将推理速度提升约5倍,代价是消耗大量GPU显存。预填充阶段构建缓存最耗时,后续解码阶段仅需处理新token。第一下慢得像老牛拉车,后面快得像火箭升空,原因全
玻璃基板承载高速算力:芯片内纳米退场,芯片间微米称王!
纳米战争退场,微米战争登基,玻璃走上王座候选席 过去五十年,半导体行业只有一个信仰:缩小。晶体管越小,芯片越猛,算力越炸。十纳米、五纳米、三纳米,一路往下卷,卷到物理定律站出来敲黑板:尺度触底,规则锁死。晶体管继续缩小的空间被自然法则封顶,行业逻辑随之转向
GPU霸主英伟达竟然要造CPU:Meta狂砸500亿美元,智能体指引AI芯片!
GPU霸主英伟达突然杀进CPU战场,Meta豪掷500亿美元买单。这不是简单的"我也卖芯片",而是一场从GPU到CPU、从硬件到软件的全生态围猎。当竞争对手还在造"兼容配件",英伟达已经在修"高速公路"——一条只有自家车能跑的特权通道。商场里的奢侈品店终于盯上
上页
下页