Claude Code,就是那个号称实现了编程AGI的“AI 编程智能体”,最近干了一件听起来像开挂的事:
它居然只花了半小时,就把 NVIDIA 的 CUDA 代码“搬家”到了 AMD 的 ROCm 平台上!
这就像把一本英文小说,半小时内翻成了法文,还不用翻译软件,直接让 AI 代笔,连剧情都没走样。
不过,先别急着喊“神了”。
这事儿就像你让 AI 帮你把小学作文改写成初中作文——简单句子它玩得转,但一遇到“量子力学读后感”那种级别的内核,它就开始挠头了。
那位网名叫 johnnytshi 的 Reddit 老哥,亲自下场实验:
“我把一整坨 CUDA 后端代码扔给 Claude Code,它咔咔半小时,全给我换成了 ROCm 能跑的版本,连翻译层都没用!”
听着像魔法,其实就像 AI 当了一回“代码搬运工”,把“cudaMalloc”换成“hipMalloc”,把“<<< >>>”这种 CUDA 专属符号换成 ROCm 的写法,逻辑没崩,还能跑。
但注意!
老哥没说他搬的是“Hello World”还是“赛博核弹级”的复杂内核。
要是只是几个“加法器”小内核,那 AI 当然能秒翻;
但真碰上那种“缓存层级、线程调度、寄存器分配”全都要手调的性能怪兽,AI 就像让中学生去解大学微积分——不是不想干,是真不会。
而且,写 GPU 内核这活儿,说白了就像“给显卡写情书”:
你得知道它喜欢什么、讨厌什么、哪根神经一碰就炸。
这种“深到硅片里”的优化,AI 现在还只能靠猜,真功夫还得老法师上手。
所以,结论一句话:
Claude Code 确实能帮你“搬家”简单 CUDA 代码到 AMD 家,省掉一堆“Hipify”这种翻译工具的麻烦;
但真碰上“性能榨干级”的复杂项目,还是得人类+AI 一起上,单靠 AI 就想一脚踹开 NVIDIA 的“CUDA 护城河”?
——兄弟,那护城河还深着呢,别急着跳。