Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
DeepSeek大模型
GB200+NVL72:72块GPU全互联终结MoE训练的通信地狱
MoE训练依赖派发、聚合与梯度同步三大通信密集型操作,GB200 NVL72凭借72-GPU全互联高带宽域,彻底解决大规模专家并行的通信瓶颈。 在当今大模型训练的最前沿,混合专家模型(Mixture of Experts,简称MoE)已经成为突破性能瓶颈的
阿里自研AI超算芯片:全球AI芯片与LLM双雄之一
《华尔街日报》:阿里巴巴开发了一款新的AI芯片,目前正在进行测试,旨在服务于更广泛的AI推理任务,同时保持与英伟达的兼容性。 很多人提到阿里巴巴,第一反应还是电商平台和“双11”。但其实,阿里真正的利润来源之一是 云计算。在亚洲市场,阿里云要和亚马
中国AI芯片突围:统一FP8标准和TileLang编程语言
中国正通过统一FP8标准与推出TileLang编程语言,构建自主AI芯片生态,虽距技术平仍有差距,但战略协同已开启国产替代关键一步。 华为、寒武纪、海光(Hygon)突然集体站台一个叫“TileLang”的新编程语言……这些看起来零散的事件,背后其实藏着一
阿里AI编程工具Qoder IDE:免费且比Cursor好
Qoder是一个为真实的软件开发而设计的代理编码平台。它将增强的上下文工程与智能代理无缝集成,以全面了解您的代码库并系统地处理软件开发任务。 特征 编码代理 任务模式 代码完成 Repo Wiki 下
DeepSeek-V3.2-Exp自研稀疏注意力引爆长文本效率革命
DeepSeek-V3.2-Exp通过自研稀疏注意力机制,在几乎不损失性能的前提下,大幅降低长上下文计算成本,为大模型推理与训练带来全新可能。 DeepSeek团队刚刚放出的实打实的“效率炸弹”——DeepSeek-V3.2-Exp。这是给大模型装
DeepSeek V3.1诡异输出"极"字事件:数据污染?
【揭秘DeepSeek V3.1诡异输出"极"字事件:量化背锅还是数据污染?】 近日,全球开发者社区掀起一场关于DeepSeek V3.1模型异常行为的激烈讨论。多位开发者发现,这款被誉为"最强开源代码模型"的AI,会在完全不合逻辑的语境下突然输出
rStar 2-Agent:微软小巧精悍的14B模型智能体
一个140亿参数的模型,竟然能在数学推理上干翻一个6710亿参数的“巨无霸”?这事儿听起来像不像“小学生打赢了职业拳王”?但就在最近,微软研究院真的做到了。 他们没靠堆数据、没靠堆算力,而是用一套叫 rStar2-Agent 的新方法,让一个小巧精
华为宣布三年内AI芯片超越英伟达 英伟达大跌
据彭博社报道,华为宣布了其三年愿景,即在人工智能芯片领域超越英伟达 华为昇腾路线图实锤:910C匹配H100,950 SuperPod计算6.7倍超NVL144,能效150%,CANN开源生态追平CUDA。彭博路透基准测试证明,2028年970双杀性能,成
阿里Qwen3 Max横空出世!非推理模型智商登顶
阿里通义千问3 Max正式上线,以55分登顶非推理模型智商榜首,多项能力全面跃升,但输出更“话痨”,仍坚守文本赛道。 阿里巴巴旗下的通义实验室正式宣布:通义千问3 Max(Qwen3 Max)全面上线,进入通用可用(GA)阶段!
DeepSeek V3.1 Terminus智压群雄登顶开源模型之王
DeepSeek V3.1 Terminus在推理模式下登顶开源模型榜首,与gpt-oss-120b并列第一,小幅领先Qwen3 235B,在指令遵循、长上下文和终端编码能力上实现显著跃升。第一章:风云再起——中国AI的“王座之争”<
推理芯片新王:AMD MI355X推理端测试完胜英伟达
Meta与OpenAI重仓AMD,用真金白银证明其推理成本优势;SemiAnalysis选择性呈现数据,掩盖AMD在GPT-OSS等模型中的真实竞争力。 【重磅揭秘】当科技圈“裁判”偏心时,谁在为真相发声?Meta豪掷42% AI芯片订单给AMD,Open
前AMD员工深度解析:CUDA生态才是英伟达真正的护城河
英伟达的护城河,靠的不是芯片,是软件!前AMD员工深度解析:英伟达未来三年仍将稳占70% AI加速器市场,CUDA生态才是真正的护城河。 最近,一位曾在AMD工作多年的资深业内人士,对整个AI加速器市场做了一次非常深刻的分析。他不仅点出了英伟达(NVIDI
从AI草图到三维渲染:建筑设计的未来已经到来
在建筑与室内设计的世界里,草图一直是一种不可或缺的表达方式。无论是建筑师在纸上勾勒的几笔,还是设计师头脑中闪过的构想,草图承载着创意的最初形态。 然而,草图的最大局限性在于,它只是一种二维的符号化表达。对于非专业人士而言,往往很难从几条线条中真正想
DeepSeek用三百万人民币训练出顶级推理模型!
DeepSeek公布其R1模型训练成本仅29.4万美元,使用512颗H800芯片训练80小时。相比美国AI巨头动辄上亿美元的开销,这一结果震动全球,突显中国AI在低成本高效率上的突破,同时引发中美AI竞争新焦点。 中国DeepSeek再爆猛料!他们
DeepSeek解码GB200性能飙升15%秘密全公开
DeepSeek FP4 MoE 在 GB200 NVL72 上通过三项核心优化实现 10–15% 吞吐提升,成果开源共享。 从七月上旬到八月三十一日,DeepSeek FP4 MoE 模型在 GB200 NVL72 平台上的解码输出吞吐性能,在所有交
EdgeAI在本地运行优化后小模型:实现高隐私智能应用
欢迎来到 EdgeAI 初学者指南——一场探索边缘人工智能(Edge AI)变革世界的全面旅程。本课程(点击标题进入github)将强大的 AI 能力与实际的边缘设备部署相结合,帮助您直接在数据生成和决策发生的地方释放 AI 的潜力。 边缘人工智能
530亿美元!阿里云栖大会打造中国AI时代的安卓
阿里押注530亿美元打造中国AI全栈生态,以开源模型圈开发者、自研芯片建算力底座,剑指“AI时代安卓+AWS”,豪赌科技自主未来。 2025年9月25日那个烟雨朦胧的杭州清晨,阿里巴巴一年一度的“云栖大会”(Apsara Conference)本该是老套路
AI+战略:中国AI落地生产工具 AI+语音或爆发
聊AI的时候,老外总爱说“未来咋咋咋”,比如美国大佬们整天念叨AGI(通用人工智能)——说哪天这玩意儿会秒杀人类智商,把军事、医学、科学、经济全掀个底朝天。 但中国这边画风不一样:AI不是“未来的饼”,而是“今天的饭”——咱不空谈,直接拿来用,还是干活的那种。
上页
下页
关闭