AMD显卡的逆天外挂!ZLUDA让CUDA不再垄断


【科技八卦速递】给AMD显卡"打鸡血"的神器ZLUDA又有新搞头啦!两位程序猿大佬现在全职在搞事情,连老游戏物理引擎和AI模型都要拿下!

还记得那个能让AMD显卡偷跑Nvidia专属CUDA程序的"外挂"吗?去年差点凉凉,结果被神秘金主爸爸救活了!现在开发组喜提新成员Violet小姐姐,加入不到一个月就带着团队在AI领域疯狂飙车~

团队壮大,专攻“人工智能”和“老游戏”
最让人激动的是,ZLUDA 团队现在有两位全职的“魔法翻译师”啦!这意味着他们能更快地翻译更多的“咒语”!

他们现在主要在两个方向发力:

  1. 搞定人工智能: 比如,我们现在很火的 大型语言模型(LLM),就像 ChatGPT 那种,ZLUDA 正在努力让它们也能在非 Nvidia 显卡上跑得飞快。
  2. 支持老游戏: 有些老游戏,尤其是用了 32位 PhysX 技术的,以前也只能在Nvidia显卡上玩。现在 ZLUDA 正在攻克这个难关,让我们的老游戏也能重焕青春!

大型语言模型 (LLM) 也能跑起来了!
ZLUDA 的开发人员正在用一个叫做 llm.c 的小测试程序,尝试让 GPT-2 这种大型语言模型在非 Nvidia 显卡上跑起来。这个测试可不简单,因为它既要处理普通的“咒语”,还要处理像 cuBLAS 这种专门用来做快速数学计算的“高级咒语”。

一开始,程序一运行就“闪退”,但现在,在一位新加入的“魔法翻译师”——Violet 的努力下,它已经能运行到一半多了!只要他们把剩下的“咒语”都翻译好,以后我们就能用非 Nvidia 显卡玩转各种大型语言模型,比如训练自己的 AI 助手什么的,想想都激动!

“各位同学们,你们知道我们电脑里的显卡(GPU)通常分为两大阵营吗?一个是Nvidia(英伟达),另一个是AMD。Nvidia 有一个独门绝技叫做 CUDA,简单来说,它就像是一套专门给Nvidia显卡用的“魔法咒语”,很多需要强大计算力的程序,比如玩游戏、做人工智能,都需要用到这套咒语才能跑起来。以前,要是你的显卡不是Nvidia的,那就没法念这套咒语,很多程序就用不了,或者跑得很慢。

不过,现在有一个超酷的项目叫做 ZLUDA,它就像一个“魔法翻译器”!它的目标就是让不是Nvidia的显卡也能听懂CUDA这套咒语,从而也能运行那些原本只能在Nvidia显卡上跑的程序。

告诉你们一个好消息,ZLUDA 这个项目现在发展得越来越好啦!

ZLUDA 差点“挂掉”,但被救活了!
去年啊,ZLUDA 这个项目差点就撑不下去了,就跟玩游戏快没血一样。但幸运的是,一家神秘的“白衣骑士”机构把它给救活了!现在,它不仅活过来了,还在飞速发展!

团队壮大,专攻“人工智能”和“老游戏”
最让人激动的是,ZLUDA 团队现在有两位全职的“魔法翻译师”啦!这意味着他们能更快地翻译更多的“咒语”!

他们现在主要在两个方向发力:

搞定人工智能: 比如,我们现在很火的 大型语言模型(LLM),就像 ChatGPT 那种,ZLUDA 正在努力让它们也能在非 Nvidia 显卡上跑得飞快。

支持老游戏: 有些老游戏,尤其是用了 32位 PhysX 技术的,以前也只能在Nvidia显卡上玩。现在 ZLUDA 正在攻克这个难关,让我们的老游戏也能重焕青春!

大型语言模型 (LLM) 也能跑起来了!
ZLUDA 的开发人员正在用一个叫做 llm.c 的小测试程序,尝试让 GPT-2 这种大型语言模型在非 Nvidia 显卡上跑起来。这个测试可不简单,因为它既要处理普通的“咒语”,还要处理像 cuBLAS 这种专门用来做快速数学计算的“高级咒语”。

一开始,程序一运行就“闪退”,但现在,在一位新加入的“魔法翻译师”——Violet 的努力下,它已经能运行到一半多了!只要他们把剩下的“咒语”都翻译好,以后我们就能用非 Nvidia 显卡玩转各种大型语言模型,比如训练自己的 AI 助手什么的,想想都激动!

让“翻译”更精准,像 Nvidia 显卡一样完美!
ZLUDA 的目标可不只是让程序能跑起来,他们还要让“翻译”出来的效果和 Nvidia 显卡运行的一模一样,甚至连计算结果的“小数点后几位”都要完全一致!这可太难了,就像要把一本复杂的英文原著,翻译成中文,而且连每个标点符号、每个字的语气都要和原文完全匹配。

他们现在正在用一种叫做 PTX“扫描”测试 的方法,就像用“显微镜”一点一点检查每个“咒语”的翻译是不是都精准无误。通过这些严格的检查,他们已经发现并修复了好几个“翻译错误”,让 ZLUDA 越来越接近完美!


战报总结:
1️⃣ 老游戏福音:正在破解32位PhysX物理引擎(就是让十年前的游戏也能在AMD显卡上蹦迪)
2️⃣ AI大招点满:已经能让GPT-2模型的小弟llm.c跑起来啦!虽然现在跑到第552步还会卡壳(总共要闯8186关)
3️⃣ 程序员狂喜:代码精确到每个比特位都要和Nvidia显卡对齐,强迫症晚期了属于是

强大的“日志系统”和“编译器”
最骚的是他们现在连Nvidia显卡的"黑话日志"都能破译了——就像拿到了CUDA的聊天记录,连cuBLAS数学库和驱动程序的悄悄话都能监听!(这操作堪比给显卡装窃听器啊)

为了更好地理解程序是怎么和 CUDA“沟通”的,ZLUDA 团队还升级了他们的“日志系统”,它就像一个超级侦探,能把程序里所有的“对话”都记录下来,包括那些之前看不到的“悄悄话”。

另外,现在的 GPU 程序都支持“运行时编译”,也就是说,程序在跑的时候,可以根据显卡的型号和性能,实时地把“咒语”编译成最适合当前显卡运行的代码。ZLUDA 也一直在努力确保自己的“编译器”能跟上最新的技术变化,尤其是 AMD 显卡那边的变化,这样才能保证我们的程序在各种显卡上都能顺利运行。


不过团队也吐槽:AMD的ROCm系统最近更新后像极了乱改接口的安卓APP,把他们都整不会了...Windows版更离谱,版本号写着2.9,身体却很诚实地用着v3的代码,妥妥的"版本欺诈"!

总的来说,ZLUDA 这个项目就像在建造一座连接不同显卡的“魔法桥梁”,让更多的显卡都能享受 CUDA 带来的强大力量,这对我们这些普通用户来说,简直太棒了!未来,大家在选择显卡的时候,就不用只盯着 Nvidia 了,会有更多选择的空间!”