文章来源:潮游速递网作者:admin发布时间:2026-02-14 03:17:09
近日,科技圈因一则消息彻底沸腾:在Reddit平台上,开发者johnnytshi分享了一项极具颠覆性的操作——Claude Code仅用30分钟,就顺利把一整套完整的CUDA后端代码移植到了AMD的ROCm平台,并且全程不需要任何中间转换层。
“CUDA花了20年时间构筑起这道护城河,可能在6个月内消失。”johnnytshi说。
ps. Claude Code是美国公司 Anthropic 推出的 AI 编程智能体工具,可深度理解代码逻辑,支持代码移植、编写等开发任务,最近爆火。
johnnytshi介绍称,整个移植过程全程零手写代码,这般高效的操作,俨然要直接填平CUDA与ROCm两大生态系统之间的鸿沟。
更值得关注的是,此次移植完全摒弃了Hipify翻译层等传统中间转换工具,仅凭命令行(CLI)一键就能完成。
就连AMD软件开发副总裁 Anush Elangovan 都对此深感震惊,直言GPU编程的未来,必将属于AI智能体。
消息一经传出,全网瞬间沸腾,不少业内人士纷纷感叹:NVIDIA坚守多年的CUDA护城河,恐怕要守不住了。这一切,究竟是怎么回事?
作为依托智能体框架运行的工具,Claude Code的核心优势在于拥有自主思考能力。在代码移植的过程中,它不会机械地替换关键词,而是可以深度理解代码逻辑,特别是特定核函数的底层运行原理。
据开发者johnnytshi介绍,此次移植中最棘手的难题——两大平台的数据布局差异,也被Claude Code完美化解,确保了内核核心计算逻辑的一致性。
更让人惊叹的是,整个移植过程仅耗时30分钟,而且不需要搭建Hipify这类复杂的翻译环境,直接通过命令行就能高效完成。这一操作的诞生,彻底消除了CUDA与ROCm之间的迁移障碍。
要清楚,NVIDIA能在GPU领域占据霸主地位,很大程度上正是依托于CUDA生态的支撑。现在,CUDA差不多成了行业内的通用标准,不计其数的AI框架、深度学习库和科学计算工具,都和它有着深度的关联。
反观AMD的ROCm,尽管自身功能强悍,但长期以来始终受困于生态兼容性不足、开发者迁移成本过高等痛点,难以与CUDA分庭抗礼。
此次Claude Code所具备的零代码、高时效移植特性,无疑为ROCm生态的发展注入了强劲动力。随着AI智能体在代码移植领域的能力持续提升,未来或将有更多CUDA代码能够便捷地适配AMD GPU运行。
当然,由于编写内核的关键在于确保“深度硬件”优化,因此有人认为Claude Code在这方面仍然存在不足,尤其是在特定的缓存层次结构方面。
但有了这个开端,NVIDIA的生态垄断,或许似乎真的要迎来变数。
事实上,上个月NVIDIA推出CUDA 13.1时,就曾引发外界对NVIDIA“护城河”是否会被削弱的讨论,尽管官方称这是“自2006年CUDA平台问世以来规模最大、最全面的一次升级”。
CUDA 13.1最核心的更新在于引入了CUDA Tile编程模型,这是一种以数据块(tile)为核心的编程范式,旨在显著降低GPU开发的技术门槛。开发者无需关注底层复杂的线程调度、内存布局优化以及硬件资源映射等细节,只需专注于将数据划分成块结构并实现相应的计算逻辑,这些底层工作会由编译器与运行时系统自动完成。
芯片设计领域的资深专家Jim Keller,曾参与AMD Zen架构、苹果A系列芯片以及特斯拉Autopilot系统的设计工作。他提出观点:若未来主流GPU编程方向逐步向Tile-based模式转变,当开发者熟悉并适应这种模式后,同一套程序逻辑将更易于在不同GPU硬件间移植——这与过去CUDA高度依赖NVIDIA硬件的情况不同,或许能为AMD、Intel或是新兴AI企业创造市场切入的契机。
农夫山泉生肖限定水被炒到1680元一套,官方明确回应:该产品仅用于赠送,不对外销售
05:45预制菜国家标准即将出台西贝表示将推动全面透明化
05:42特斯拉全球副总裁陶琳表示:针对特斯拉的抹黑行为,背后的情况确实不简单
05:35《逆战未来》联动《鬼吹灯》赛季新角色首次曝光!
05:32演唱会神器!OPPOFindX9Ultra配备10倍光学变焦:远距离拍摄超给力
05:25专属豪华内饰套装加持!乐道L90马到成功版正式上市,起售价21.08万元
05:21宝马也顶不住压力了!新款3系、i3和X3降价后正式上市,起售价25.8万元
05:18育碧宣布终止《波斯王子》等多个游戏项目后,其股价暴跌超40%,分析人士指出股市对该公司已丧失信心
05:14iQOO15Ultra参数曝光:配备行业最大风扇与2K三星屏,系品牌首款性能Ultra机型
05:11