文章来源:潮游速递网作者:admin发布时间:2026-02-17 17:47:05
英伟达借今年的NeurIPS大会展示了旨在加速自动驾驶汽车普及的全新AI技术。
在圣地亚哥的活动现场,该公司对Alpamayo-R1(AR1)进行了展示,并宣称这是全球首款达到工业级规模的开放推理型视觉语言动作(VLA)自动驾驶模型。
VLA模型可以同时处理文本和图像,这意味着车辆传感器可以将他们“看到”的内容转化为使用自然语言的描述。
英伟达有一款软件,其命名源自秘鲁安第斯山脉中一座被视作难以拓展的山峰。这款软件把思维链式的人工智能推理和路径规划融合起来,让它能够比以往的自动驾驶软件更出色地应对复杂状况——就如同人类的思考方式,先把场景拆解开来,考量所有可能的选择,之后再采取下一步行动。
英伟达指出,这一能力对达成四级自动化而言意义重大——按照汽车工程师学会的定义,四级自动化指的是汽车在特定场景下能够完全掌控驾驶流程。
在与Alpamayo-R1同步发布的一篇博客文章里,英伟达应用深度学习研究副总裁Bryan Catanzaro通过举例阐述了它的工作原理。
卡坦扎罗指出:“借助AR1所支持的思维链推理能力,自动驾驶车辆在行人较多的自行车道附近行驶时,能够从行驶路径中收集数据,同时结合推理过程中留下的痕迹——也就是对采取特定行动原因的解释——并运用这些信息来规划后续的行驶轨迹,例如驶离自行车道或者为可能突然横穿马路的人停车。”
英伟达还提到,AR1的人文推理还能帮助其他细致情景,包括行人密集的路口、即将关闭的车道,或车辆双排停在自行车道上。
AR1借助高效的推理思维模式,使工程师能够更清晰地把握特定决策的背后逻辑,这无疑能帮助他们进一步深化对车辆安全优化路径的理解。
该模型以英伟达今年初推出的Cosmos Reason为基础,其开放权限能让研究人员依据自身非商业场景开展定制工作,不管是用于基准测试,还是打造专属杀毒软件都适用。
AR1 可在 GitHub 与 Hugging Face 平台获取,据 Catanzaro 所述,经过训练的强化学习“效果尤为突出”,研究人员也指出其推理能力“得到了明显增强”。
微软时隔三十载推出全新Win11“运行”对话框26534预览版现已上线
19:20黄仁勋正犯愁呢!哪怕H200AIGPU获准对华出口,他也吃不准中国会不会买账
19:16Meta打算对元宇宙相关预算进行削减,幅度最高可达30%
19:09微软方面表示,将于明年7月对Microsoft365商业版的订阅价格进行上调
19:06AMD入门级移动APU锐龙AI5430亮相:性能大涨19%!
19:02Meta整合Facebook与Instagram的支持体系,启动AI助手功能测试
18:59新能源车主竟能靠卖电创收:有人单月最高进账近2万元
18:55雷军表示:小米YU7的四大核心指标全部通过“一级能效”认证
18:52比亚迪电池工厂推行无瑕运营:力求产品“0缺陷”
18:49