Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
芯片半导体
DeepSeek搭载英特尔芯片性能狂飙28倍!
KTransformers推出基于英特尔芯片的DeepSeek-R1/V3,性能飙升28倍! 大家好,我们是 KTransformers 团队(以前因为做了一个叫 DeepSeek-V2 的本地 CPU/GPU 混合推理开源项目而挺有名的)。
王道:3090显卡跑DeepSeek Qwen-32B
DeepSeek模型MMLU Pro测试:越大模型表现更优,在单个3090上运行Qwen 32B才是王道:
Framework Desktop:跑DeepSeek够不够强
Framework Desktop是不是被吹得太厉害了,说它能跑DeepSeek这样的大模型LLM?但实际上,它的内存不够大,没法搞MoE(专家混合模型),带宽也不够,跑不了那些需要大量计算的密集型模型。 理论上,128GB内存跑LLM会因为带宽不够而卡顿
英伟达RTX 4090 96GB显存AI版量产曝光
据报道,NVIDIA 的 GeForce RTX 4090 装了 96GB 的显存;这个显卡可能会很快开始大规模生产,瞄准 AI 工作负载。 报告里说了,真有装了高达 96GB 显存的 RTX 4090,可能会在几个月内卖到市场上。看来之前
深圳96GB改装RTX4090跑DeepSeek,仅4.5万美元
性能强劲。跑 deepseek 速度超快,功能齐全充性能,原装未拆封 4090涡轮显卡打折仅96GB,全新靠谱,性能无敌!不挑系统! 不挑驱动!
英伟达用DeepSeek自动榨取GPU性能
英伟达新博客文章:LLM生成的GPU内核显示了FlexAttention的加速。前有DeepSeek极端榨取英伟达GPU硬件性能被曝光,英伟达反其道,用DeepSee
性价比之王:deepseek-r1-distill-llama-70b
deepseek/deepseek-r1-distill-llama-70b位列排名榜第三名,排在openai/o1和deepseek-r1之后:
英伟达华硕重磅推出本地部署AI电脑
两款支持大模型本地开发和云部署的新AI计算机发布:华硕推出了Ascent GX10 AI超级计算机,搭载NVIDIA GB10 Grace Blackwell超级芯片,性能强大,支持高达1,000 TOPS的AI处理能力和128GB内存,适合处理大型AI模型。英伟达
DeepSeek启示:通信是训练与推理最大区别
DeepSeek极端榨取硬件性能,看起来不同寻常!推理和训练之间最大的区别之一是通信需求。 1、对于推理:芯片之间不需要太多通信。你可以把它想象成普通的
谷歌Gemma 3:单GPU性能超DeepSeek
谷歌认为自家Gemma 3是“世界上最好的单加速器模型”,在单个 GPU 上比 Facebook 的 Llama、DeepSeek和 OpenAI 的模型都强,而且在
奥特曼:AI智能三个发展规律
AI智能三个发展规律:资源驱动、成本骤降、经济价值飙升。 OpenAI山姆奥特曼最近认为:工智能的规模定律将保持不变,“没有理由在不久的将来停止指数级增加投资”! 1. AI智能与资源的关
特斯拉Optimus引领人形机器人革命
特斯拉的Optimus有望成为下一个革命性产品,将超越智能手机,成为我们这个时代的标志性技术。 Optimus不仅仅是一个
英伟达2025 GTC扔出六项重磅AI技术
Nvidia 在 2025 年的 GTC 大会上推出了一堆新产品和新技术,准备迎接 AI 推理的新时代。这次发布会的重点是 BlackwellUltra 平台。
失败案例:GPU算力租借
这篇文字主要讲述了公司在构建公共云服务过程中,对GPU支持的探索和挑战。公司最初投入大量资金,押注于为AI/ML推理任务提供GPU支持,并创建了Fly GPU Machines。然而,尽管GPU在AI/ML领域的重要性被正确判断,但公司发现其产品可能并不适合当前市场需求,尤其是开发者更倾向于
Apple自玩游戏训练自己的自动驾驶AI系统
Apple 用自己玩游戏的方式造出了一些特别厉害的自动驾驶汽车“大脑”:……自动驾驶的未来可以通过模拟和现实世界的数据来实现…… Apple 的研究人员完全通过自己玩游戏的方式训练了一些聪明的
物理引擎驱动的可爱人形机器人亮相GTC
NVIDIA 刚刚在 GTC 2025 上发布了“Blue”,这是一款与迪士尼研究院和 Google DeepMind 合作开发的人形机器人。 Blue 背后最大的技术之一是新发布的 Newton牛顿物理引擎,这是一款专为机器人设计的
微软量子突破:一个芯片100万量子比特
Majorana 1:世界上第一个由拓扑核心驱动的量子处理单元 (QPU),设计用于在单个芯片上扩展到一百万个量子比特。
超越DeepSeek!Mistral新模型最快?
上页
下页