Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
芯片半导体
用8片RTX 4090构建本地模型AI服务器
使用 8xRTX 4090 构建 GPU 服务器实现大模型本地部署和运行推理:Marco Mascorro 构建了一个非常酷的 8x4090 服务器用于本地推理,并编写了一个非常详细的操作指南,介绍了他使用了哪些部件以及如何将所有部件组合在一起。
美国AI闭源等死,中国AI开源碾压
本文来自一美国博文:我们需要一个美国版的深度求索(DeepSeek)。 我们需要一个自主、开源的通用人工智能(AGI)巨头,而且现在就要。 因为美国的前沿实验室正在输掉这场竞赛。 不信? 每出现一个美国的闭源或专有模型,我们就能看
华硕GX10 AI超算仅2999刀!性能碾压DGX
华硕推出自己的迷你 AI 超级计算机:Ascent GX10 售价 2999 美元,配备 Nvidia 的 GB10 Grace Blackwell 超级芯片,它比 Nvidia 的 DGX Spark 便宜很多,但存储空间较小。 要点:
Llama.cpp GeForce RTX 5090的AI性能测
在开始用GeForce RTX 5090的计算性能做NVIDIA Blackwell Linux测试时,除了上周发布的所有CUDA/OpenCL/OptiX基准测试,很多读者还问了AI性能,特别是RTX 5090旗舰显卡在Llama.cpp里的表现。下面是一些初步的基准测试,比较了GeFor
谷歌TPUv7硬刚英伟达GB200!
在 Google Cloud Next 25 大会上,谷歌隆重推出第七代张量处理单元 (TPU) Ironwood。它是可扩展性最强的定制 AI 加速器,也是首款专为推理而设计的加速器。 谷歌TPUv7: 每秒能算4.6千万亿次浮点
RISC-V巨兽来袭!Bolt Zeus GPU剑指NVIDIA
Bolt Graphics的Zeus系列GPU采用RISC-V架构,集成大容量内存和高速网络(400G/800GbE),适合集群计算。目标低功耗、高扩展性,2025年推开发套件。若实现性能突破,或挑战NVIDIA,但需观望实际表现。
苹果M3+Llama 4=本地AI天作之合!
Llama 4 + Apple Silicon 简直是天生一对。 原因在这儿:就像 DeepSeek V3/R1 一样,新的 Llama 4 各种版本都是超大的稀疏 MoE 模型。它们有海量的参数,但每次生成一个token词的时候,只有很少一部分参
谷歌Gemma 3:单GPU性能超DeepSeek
谷歌认为自家Gemma 3是“世界上最好的单加速器模型”,在单个 GPU 上比 Facebook 的 Llama、DeepSeek和 OpenAI 的模型都强,而且在
1块GPU同跑50个大模型:2秒切换快照
我们搞了个AI模型"闪电启动器",让大模型像Windows休眠功能一样秒开秒关! 以前跑AI大模型特别麻烦——每次用都要重新加载,像开电脑等系统启动一样慢,而且显卡内存根本塞不下几个模型。现在我们搞出了新方法,2-5秒就能唤醒一个AI(130亿到650亿参
芯粒+异构集成=算力核爆
“小芯片chiplet”和“混合组装”这两个词现在满天飞,新闻里、论文里、产品发布会上到处都是。虽然工程师们基本能看懂这些内容,但做报告的人讲到一半也常会卡壳。
AI算力暴增:Python原生支持CUDA加速
英伟达终于给自家的CUDA工具包装上了原生的Python支持。要是你对编程、人工智能感兴趣,或者单纯爱看黑科技突破,这回可算来着了!Python这几年火得不行,GitHub 2024年调查显示它已经干掉了JavaScript,成了全球最受欢迎的编程语言。
微软砍掉120亿数据中心的背后隐情
知情人士透露,微软决定不使用一个价值近120亿美元的选择权,这个选择权原本是用来从CoreWeave购买更多数据中心容量的。这个决定显示出,大型科技公司正在开始调整和定制他们在人工智能(AI)领域的预算。 CoreWeave正准备进行今年最受关注的
宫崎骏文生图爆火!ChatGPT算力告急
因为用的人太多,OpenAI 现在暂时不让新用户玩 Sora 视频生成功能了。这事儿发生的时候,他们正忙着应付大家疯抢新出的 GPT-4o 图片功能——之前有个叫 Ghibli 的功能太火爆,直接把他们的显卡算力给榨干了。不过新用户还是能正常玩图片生成,只是视频功能
本地部署+算法优化破解AI能耗危机
2024年11月,美国管电的部门FERC对亚马逊说:"不行!"原来亚马逊想从宾州一个核电站直接买电给自己数据中心用,这样能多买180兆瓦(够18万户家庭用)。但政府说这对其他用户不公平:这就像插队买奶茶,你爽了别人就得等更久。 美国电不够用了?过去20年美
DeepSeek黑科技SPCT:算力不变,性能翻番
DeepSeek 的通用奖励模型(GRM)通过推理时缩放优化奖励信号,让本地大模型更高效:减少训练成本——动态调整计算量,避免冗余训练;提升泛化能力——适应多任务,无需反复微调;开源可商用——本地部署更灵活,降低依赖云端成本。</
为何人形机器人总是喜欢表演跳舞?
你知道为什么他们总是展示人形机器人跳舞,跳跃,跑步等,而不是让他们做一些有用的工作,因为让机器人做有用的工作意味着让它能够“思考”。他们不知道如何实现这一目标。 网友认为:这些表演动作其实展示了硬件平台和软件接口的功能。而思考是一项单独的挑战,可以通过各种
中国科学家研制出先进固态深紫外激光源
中国科学家取得重大突破,成功研发出新型固态深紫外 (DUV) 激光器。这项创新的激光技术将彻底改变半导体制造必不可少的光刻设备。 中国科学家开发出一种固态深紫外 (DUV) 激光器,可增强半导体光刻技术。该激光器工作波长为 177.3 nm,与传统
贸易战惊现豁免,手机电脑免税
就在白宫一边到处打贸易战一边忙着安抚全球市场的时候,特朗普政府突然宣布:手机、电脑这些电子产品不用交巨额"对等关税"了!这下可把苹果这些科技巨头乐坏了。 海关周五半夜发的通知说,智能手机、路由器、芯片机、无线耳机还有部分电脑,都不用交特朗普对中国货加征的1
上页
下页