DeepSeek大模型

GB200+NVL72：72块GPU全互联终结MoE训练的通信地狱

MoE训练依赖派发、聚合与梯度同步三大通信密集型操作，GB200 NVL72凭借72-GPU全互联高带宽域，彻底解决大规模专家并行的通信瓶颈。在当今大模型训练的最前沿，混合专家模型（Mixture of Experts，简称MoE）已经成为突破性能瓶颈的

阿里自研AI超算芯片：全球AI芯片与LLM双雄之一

《华尔街日报》：阿里巴巴开发了一款新的AI芯片，目前正在进行测试，旨在服务于更广泛的AI推理任务，同时保持与英伟达的兼容性。很多人提到阿里巴巴，第一反应还是电商平台和“双11”。但其实，阿里真正的利润来源之一是云计算。在亚洲市场，阿里云要和亚马

中国AI芯片突围：统一FP8标准和TileLang编程语言

中国正通过统一FP8标准与推出TileLang编程语言，构建自主AI芯片生态，虽距技术平仍有差距，但战略协同已开启国产替代关键一步。华为、寒武纪、海光（Hygon）突然集体站台一个叫“TileLang”的新编程语言……这些看起来零散的事件，背后其实藏着一

阿里AI编程工具Qoder IDE：免费且比Cursor好

Qoder是一个为真实的软件开发而设计的代理编码平台。它将增强的上下文工程与智能代理无缝集成，以全面了解您的代码库并系统地处理软件开发任务。特征编码代理任务模式代码完成 Repo Wiki 下

DeepSeek-V3.2-Exp自研稀疏注意力引爆长文本效率革命

DeepSeek-V3.2-Exp通过自研稀疏注意力机制，在几乎不损失性能的前提下，大幅降低长上下文计算成本，为大模型推理与训练带来全新可能。 DeepSeek团队刚刚放出的实打实的“效率炸弹”——DeepSeek-V3.2-Exp。这是给大模型装

DeepSeek V3.1诡异输出"极"字事件：数据污染？

【揭秘DeepSeek V3.1诡异输出"极"字事件：量化背锅还是数据污染？】近日，全球开发者社区掀起一场关于DeepSeek V3.1模型异常行为的激烈讨论。多位开发者发现，这款被誉为"最强开源代码模型"的AI，会在完全不合逻辑的语境下突然输出

rStar 2-Agent：微软小巧精悍的14B模型智能体

一个140亿参数的模型，竟然能在数学推理上干翻一个6710亿参数的“巨无霸”？这事儿听起来像不像“小学生打赢了职业拳王”？但就在最近，微软研究院真的做到了。他们没靠堆数据、没靠堆算力，而是用一套叫 rStar2-Agent 的新方法，让一个小巧精

华为宣布三年内AI芯片超越英伟达英伟达大跌

据彭博社报道，华为宣布了其三年愿景，即在人工智能芯片领域超越英伟达华为昇腾路线图实锤：910C匹配H100，950 SuperPod计算6.7倍超NVL144，能效150%，CANN开源生态追平CUDA。彭博路透基准测试证明，2028年970双杀性能，成

阿里Qwen3 Max横空出世！非推理模型智商登顶

阿里通义千问3 Max正式上线，以55分登顶非推理模型智商榜首，多项能力全面跃升，但输出更“话痨”，仍坚守文本赛道。阿里巴巴旗下的通义实验室正式宣布：通义千问3 Max（Qwen3 Max）全面上线，进入通用可用（GA）阶段！

DeepSeek V3.1 Terminus智压群雄登顶开源模型之王

DeepSeek V3.1 Terminus在推理模式下登顶开源模型榜首，与gpt-oss-120b并列第一，小幅领先Qwen3 235B，在指令遵循、长上下文和终端编码能力上实现显著跃升。第一章：风云再起——中国AI的“王座之争”<

推理芯片新王：AMD MI355X推理端测试完胜英伟达

Meta与OpenAI重仓AMD，用真金白银证明其推理成本优势；SemiAnalysis选择性呈现数据，掩盖AMD在GPT-OSS等模型中的真实竞争力。【重磅揭秘】当科技圈“裁判”偏心时，谁在为真相发声？Meta豪掷42% AI芯片订单给AMD，Open

前AMD员工深度解析：CUDA生态才是英伟达真正的护城河

英伟达的护城河，靠的不是芯片，是软件！前AMD员工深度解析：英伟达未来三年仍将稳占70% AI加速器市场，CUDA生态才是真正的护城河。最近，一位曾在AMD工作多年的资深业内人士，对整个AI加速器市场做了一次非常深刻的分析。他不仅点出了英伟达（NVIDI

从AI草图到三维渲染：建筑设计的未来已经到来

在建筑与室内设计的世界里，草图一直是一种不可或缺的表达方式。无论是建筑师在纸上勾勒的几笔，还是设计师头脑中闪过的构想，草图承载着创意的最初形态。然而，草图的最大局限性在于，它只是一种二维的符号化表达。对于非专业人士而言，往往很难从几条线条中真正想

DeepSeek用三百万人民币训练出顶级推理模型！

DeepSeek公布其R1模型训练成本仅29.4万美元，使用512颗H800芯片训练80小时。相比美国AI巨头动辄上亿美元的开销，这一结果震动全球，突显中国AI在低成本高效率上的突破，同时引发中美AI竞争新焦点。中国DeepSeek再爆猛料！他们

DeepSeek解码GB200性能飙升15%秘密全公开

DeepSeek FP4 MoE 在 GB200 NVL72 上通过三项核心优化实现 10–15% 吞吐提升，成果开源共享。从七月上旬到八月三十一日，DeepSeek FP4 MoE 模型在 GB200 NVL72 平台上的解码输出吞吐性能，在所有交

EdgeAI在本地运行优化后小模型：实现高隐私智能应用

欢迎来到 EdgeAI 初学者指南——一场探索边缘人工智能（Edge AI）变革世界的全面旅程。本课程(点击标题进入github)将强大的 AI 能力与实际的边缘设备部署相结合，帮助您直接在数据生成和决策发生的地方释放 AI 的潜力。边缘人工智能

530亿美元！阿里云栖大会打造中国AI时代的安卓

阿里押注530亿美元打造中国AI全栈生态，以开源模型圈开发者、自研芯片建算力底座，剑指“AI时代安卓+AWS”，豪赌科技自主未来。 2025年9月25日那个烟雨朦胧的杭州清晨，阿里巴巴一年一度的“云栖大会”（Apsara Conference）本该是老套路

AI+战略：中国AI落地生产工具 AI+语音或爆发

聊AI的时候，老外总爱说“未来咋咋咋”，比如美国大佬们整天念叨AGI（通用人工智能）——说哪天这玩意儿会秒杀人类智商，把军事、医学、科学、经济全掀个底朝天。但中国这边画风不一样：AI不是“未来的饼”，而是“今天的饭”——咱不空谈，直接拿来用，还是干活的那种。