Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
pyTorch
智能体30分钟一键把CUDA项目转成ROCm真实案例:20年CUDA护城河被填平!
这个开源提交中(点击标题)展示了一次真实的CUDA到ROCm移植事件,完整拆解GPU软件护城河的真实结构! 借助Claude Code等AI编程代理,CUDA到ROCm的移植已从高难度工程降级为模式匹配任务,结合HIP与CUDA的高度相似性及AI对
CUDA高效编程第一性原理:数据搬运 vs. 并行计算
这一篇从基本原理翻译讲清楚CUDA是让程序员主动管好并行工作、数据搬运和内存访问。它的性能关键在内存访问模式、线程并行覆盖等待、分块合作重用数据等,而不是简单“更多线程”。 为什么过去CPU自动加速终结了
PyTorch和TensorFlow比较 - thegradient
在2019年,机器学习框架之战还有两个主要竞争者:PyTorch和TensorFlow。我的分析表明,研究人员正在放弃TensorFlow并大量涌向PyTorch。 为什么研究人员喜欢PyTorch?
2022年TensorFlow没落
看到 TensorFlow 的下滑程度令人震惊。最近发布的 2022 年机器学习竞争状况报告描绘了一幅非常严峻的画面——只有 4% 的获胜项目是使用 TensorFlow 构建的。这与几年前形成鲜明对比,当时 TensorFlow 拥有深度学习几乎整个领域。
股票预测神经网络和机器学习示例
本项目是使用样本股票数据的 Python 神经网络和 ML 股票预测方法示例。 ML 和 NN 方法和库的资料库,以及用于训练和测试的样本股数据。这些示例简单易懂,突出了每种方法的基本组成部分。示例还展示了如何在当前数据上运行模型,以获得股票预测结
英伟达深夜突袭PyTorch!闭源CuTeDSL横空出世,FlexAttention性能翻倍
前英伟达CUDA架构师“老K”爆料:PyTorch最新版本秘密集成英伟达闭源CuTeDSL,FlexAttention性能暴增2倍,Triton被边缘化,开源生态遭重创,Blackwell新特性全面锁死,AMD与谷歌应对无力,AI编译器战争进入闭源霸权时代。英伟达深夜突袭Py