芯片半导体

用8片RTX 4090构建本地模型AI服务器

使用 8xRTX 4090 构建 GPU 服务器实现大模型本地部署和运行推理：Marco Mascorro 构建了一个非常酷的 8x4090 服务器用于本地推理，并编写了一个非常详细的操作指南，介绍了他使用了哪些部件以及如何将所有部件组合在一起。

美国AI闭源等死，中国AI开源碾压

本文来自一美国博文：我们需要一个美国版的深度求索（DeepSeek）。我们需要一个自主、开源的通用人工智能（AGI）巨头，而且现在就要。因为美国的前沿实验室正在输掉这场竞赛。不信？每出现一个美国的闭源或专有模型，我们就能看

华硕GX10 AI超算仅2999刀！性能碾压DGX

华硕推出自己的迷你 AI 超级计算机：Ascent GX10 售价 2999 美元，配备 Nvidia 的 GB10 Grace Blackwell 超级芯片，它比 Nvidia 的 DGX Spark 便宜很多，但存储空间较小。要点：

Llama.cpp GeForce RTX 5090的AI性能测

在开始用GeForce RTX 5090的计算性能做NVIDIA Blackwell Linux测试时，除了上周发布的所有CUDA/OpenCL/OptiX基准测试，很多读者还问了AI性能，特别是RTX 5090旗舰显卡在Llama.cpp里的表现。下面是一些初步的基准测试，比较了GeFor

谷歌TPUv7硬刚英伟达GB200！

在 Google Cloud Next 25 大会上，谷歌隆重推出第七代张量处理单元 (TPU) Ironwood。它是可扩展性最强的定制 AI 加速器，也是首款专为推理而设计的加速器。谷歌TPUv7：每秒能算4.6千万亿次浮点

RISC-V巨兽来袭！Bolt Zeus GPU剑指NVIDIA

Bolt Graphics的Zeus系列GPU采用RISC-V架构，集成大容量内存和高速网络（400G/800GbE），适合集群计算。目标低功耗、高扩展性，2025年推开发套件。若实现性能突破，或挑战NVIDIA，但需观望实际表现。

苹果M3+Llama 4=本地AI天作之合！

Llama 4 + Apple Silicon 简直是天生一对。原因在这儿：就像 DeepSeek V3/R1 一样，新的 Llama 4 各种版本都是超大的稀疏 MoE 模型。它们有海量的参数，但每次生成一个token词的时候，只有很少一部分参

谷歌Gemma 3：单GPU性能超DeepSeek

谷歌认为自家Gemma 3是“世界上最好的单加速器模型”，在单个 GPU 上比 Facebook 的 Llama、DeepSeek和 OpenAI 的模型都强，而且在

1块GPU同跑50个大模型：2秒切换快照

我们搞了个AI模型"闪电启动器"，让大模型像Windows休眠功能一样秒开秒关！以前跑AI大模型特别麻烦——每次用都要重新加载，像开电脑等系统启动一样慢，而且显卡内存根本塞不下几个模型。现在我们搞出了新方法，2-5秒就能唤醒一个AI（130亿到650亿参

芯粒+异构集成=算力核爆

“小芯片chiplet”和“混合组装”这两个词现在满天飞，新闻里、论文里、产品发布会上到处都是。虽然工程师们基本能看懂这些内容，但做报告的人讲到一半也常会卡壳。

AI算力暴增：Python原生支持CUDA加速

英伟达终于给自家的CUDA工具包装上了原生的Python支持。要是你对编程、人工智能感兴趣，或者单纯爱看黑科技突破，这回可算来着了！Python这几年火得不行，GitHub 2024年调查显示它已经干掉了JavaScript，成了全球最受欢迎的编程语言。

微软砍掉120亿数据中心的背后隐情

知情人士透露，微软决定不使用一个价值近120亿美元的选择权，这个选择权原本是用来从CoreWeave购买更多数据中心容量的。这个决定显示出，大型科技公司正在开始调整和定制他们在人工智能（AI）领域的预算。 CoreWeave正准备进行今年最受关注的

宫崎骏文生图爆火！ChatGPT算力告急

因为用的人太多，OpenAI 现在暂时不让新用户玩 Sora 视频生成功能了。这事儿发生的时候，他们正忙着应付大家疯抢新出的 GPT-4o 图片功能——之前有个叫 Ghibli 的功能太火爆，直接把他们的显卡算力给榨干了。不过新用户还是能正常玩图片生成，只是视频功能

本地部署+算法优化破解AI能耗危机

2024年11月，美国管电的部门FERC对亚马逊说："不行！"原来亚马逊想从宾州一个核电站直接买电给自己数据中心用，这样能多买180兆瓦（够18万户家庭用）。但政府说这对其他用户不公平：这就像插队买奶茶，你爽了别人就得等更久。美国电不够用了？过去20年美

DeepSeek黑科技SPCT：算力不变，性能翻番

DeepSeek 的通用奖励模型（GRM）通过推理时缩放优化奖励信号，让本地大模型更高效：减少训练成本——动态调整计算量，避免冗余训练；提升泛化能力——适应多任务，无需反复微调；开源可商用——本地部署更灵活，降低依赖云端成本。</

为何人形机器人总是喜欢表演跳舞？

你知道为什么他们总是展示人形机器人跳舞，跳跃，跑步等，而不是让他们做一些有用的工作，因为让机器人做有用的工作意味着让它能够“思考”。他们不知道如何实现这一目标。网友认为：这些表演动作其实展示了硬件平台和软件接口的功能。而思考是一项单独的挑战，可以通过各种

中国科学家研制出先进固态深紫外激光源

中国科学家取得重大突破，成功研发出新型固态深紫外 (DUV) 激光器。这项创新的激光技术将彻底改变半导体制造必不可少的光刻设备。中国科学家开发出一种固态深紫外 (DUV) 激光器，可增强半导体光刻技术。该激光器工作波长为 177.3 nm，与传统

贸易战惊现豁免，手机电脑免税

就在白宫一边到处打贸易战一边忙着安抚全球市场的时候，特朗普政府突然宣布：手机、电脑这些电子产品不用交巨额"对等关税"了！这下可把苹果这些科技巨头乐坏了。海关周五半夜发的通知说，智能手机、路由器、芯片机、无线耳机还有部分电脑，都不用交特朗普对中国货加征的1