CUDA护城河时代终结:ClaudeCode仅用30分钟将CUDA后端移植到ROCm


Claude Code,就是那个号称实现了编程AGI的“AI 编程智能体”,最近干了一件听起来像开挂的事:  
它居然只花了半小时,就把 NVIDIA 的 CUDA 代码“搬家”到了 AMD 的 ROCm 平台上!  
这就像把一本英文小说,半小时内翻成了法文,还不用翻译软件,直接让 AI 代笔,连剧情都没走样。

不过,先别急着喊“神了”。  
这事儿就像你让 AI 帮你把小学作文改写成初中作文——简单句子它玩得转,但一遇到“量子力学读后感”那种级别的内核,它就开始挠头了。

那位网名叫 johnnytshi 的 Reddit 老哥,亲自下场实验:  
“我把一整坨 CUDA 后端代码扔给 Claude Code,它咔咔半小时,全给我换成了 ROCm 能跑的版本,连翻译层都没用!”  
听着像魔法,其实就像 AI 当了一回“代码搬运工”,把“cudaMalloc”换成“hipMalloc”,把“<<< >>>”这种 CUDA 专属符号换成 ROCm 的写法,逻辑没崩,还能跑。

但注意!  
老哥没说他搬的是“Hello World”还是“赛博核弹级”的复杂内核。  
要是只是几个“加法器”小内核,那 AI 当然能秒翻;  
但真碰上那种“缓存层级、线程调度、寄存器分配”全都要手调的性能怪兽,AI 就像让中学生去解大学微积分——不是不想干,是真不会。

而且,写 GPU 内核这活儿,说白了就像“给显卡写情书”:  
你得知道它喜欢什么、讨厌什么、哪根神经一碰就炸。  
这种“深到硅片里”的优化,AI 现在还只能靠猜,真功夫还得老法师上手。

所以,结论一句话:  
Claude Code 确实能帮你“搬家”简单 CUDA 代码到 AMD 家,省掉一堆“Hipify”这种翻译工具的麻烦;  
但真碰上“性能榨干级”的复杂项目,还是得人类+AI 一起上,单靠 AI 就想一脚踹开 NVIDIA 的“CUDA 护城河”?  
——兄弟,那护城河还深着呢,别急着跳。

详细:智能体30分钟一键把CUDA项目转成ROCm真实案例:20年CUDA护城河被填平!