• 这一篇从基本原理翻译讲清楚CUDA是让程序员主动管好并行工作、数据搬运和内存访问。它的性能关键在内存访问模式、线程并行覆盖等待、分块合作重用数据等,而不是简单“更多线程”。 为什么过去CPU自动加速终结了
  • 在2019年,机器学习框架之战还有两个主要竞争者:PyTorch和TensorFlow。我的分析表明,研究人员正在放弃TensorFlow并大量涌向PyTorch。 为什么研究人员喜欢PyTorch? icon
  • 看到 TensorFlow 的下滑程度令人震惊。最近发布的 2022 年机器学习竞争状况报告描绘了一幅非常严峻的画面——只有 4% 的获胜项目是使用 TensorFlow 构建的。这与几年前形成鲜明对比,当时 TensorFlow 拥有深度学习几乎整个领域。 icon
  • 本项目是使用样本股票数据的 Python 神经网络和 ML 股票预测方法示例。 ML 和 NN 方法和库的资料库,以及用于训练和测试的样本股数据。这些示例简单易懂,突出了每种方法的基本组成部分。示例还展示了如何在当前数据上运行模型,以获得股票预测结 icon
  • 前英伟达CUDA架构师“老K”爆料:PyTorch最新版本秘密集成英伟达闭源CuTeDSL,FlexAttention性能暴增2倍,Triton被边缘化,开源生态遭重创,Blackwell新特性全面锁死,AMD与谷歌应对无力,AI编译器战争进入闭源霸权时代。英伟达深夜突袭Py icon