当前位置:首页 > 攻略秘籍 > 英伟达发布Nemotron3模型系列,以此作为代理AI系统的开放基石

英伟达发布Nemotron3模型系列,以此作为代理AI系统的开放基石

文章来源:潮游速递网作者:admin发布时间:2026-02-11 12:05:11

英伟达公司今日宣布推出Nemotron 3,这是一个开放的模型与数据库家族,其目标是为各行业的下一代代理人工智能操作提供支持。

新的模型家族将包括三种尺寸:Nano、Super和Ultra。公司采用突破性的架构构建了这些模型,使用混合潜在专家混合方法来压缩内存需求,优化计算并为不同尺寸提供卓越的智能。

据公司称,最小的模型Nemotron 3 Nano的吞吐量是其前代产品的四倍,同时保持高性能。

“开放创新是AI发展的基石,”英伟达公司创始人兼首席执行官黄仁勋指出,“借助Nemotron,我们把先进的AI打造成一个开放平台,为开发者提供构建大规模代理系统所需的透明性与效率。”

公司表示,这些AI模型的发布应对了行业对需要推理和工具编排的代理AI应用的快速采用。单一模型聊天机器人的时代正在让位于编排的AI应用,这些应用自动化多个模型以推动主动和智能代理。

Nemotron 3的推出也使英伟达更直接地面对一个日益增长的开放和半开放推理模型领域,因为竞争从原始参数数量转向编排、可靠性和以代理为中心的性能。

利用其新架构,英伟达表示将帮助降低成本,同时仍提供高速、可靠的推理和智能。

今天发布的Nano是一款小型模型,参数规模达300亿,其中活跃参数为30亿,主要面向针对性强、效率要求高的任务场景。接下来的Super模型规模更大,拥有1000亿总参数与100亿活跃参数,目标是为多代理应用提供中等水平的智能支持。而Ultra作为大型推理引擎,总参数高达5000亿,活跃参数为500亿,将为复杂AI应用及代理编排环节提供推理能力。

Nemotron Super在整合多个AI代理、以低延迟协作完成复杂任务的场景中表现优异。而Nemotron Ultra则被定位为,在那些需要深度研究与长期战略规划的高要求AI工作流里,充当核心的强大“智能中枢”。

Nano现已上市,Super将在2026年第一季度推出,Ultra预计将在明年上半年推出。

使用公司超高效的4位NVPF4训练格式,开发者和工程师可以在较少数量的图形处理单元上部署模型,显著减少内存占用。高效的训练过程还允许模型通过蒸馏缩小规模,而不会显著损失准确性或推理能力。

Nemotron系列的首批应用者有埃森哲公司、CrowdStrike Holdings Inc.、甲骨文云基础设施、Palantir Technologies Inc.、Perplexity AI Inc.、ServiceNow Inc.、西门子公司以及Zoom Communications Inc.。

“Perplexity的创立基于这样一种理念:人类的好奇心能够借助集成于优质工具里的精准AI得到增强,像AI助手这类工具就是如此,”Perplexity首席执行官阿拉文·斯里尼瓦斯表示,“借助我们的代理路由器,我们能够把工作负载分配给经过最佳微调的开放模型,例如Nemotron 3 Ultra。”

随着这些模型的发布,英伟达在生态系统驱动的采用上押下重注,以创造互惠互利的共生关系。虽然新模型不需要英伟达硬件运行,但由于内部架构优化,它们高度优化于英伟达设计的平台和显卡。

公司还强调了其保持模型发布可靠性路线图的意图。尽管当前AI模型发布的节奏可能让人感到无情,几乎每月都有新发布,英伟达表示其目标是为开发者提供更清晰的模型成熟度和每个开源家族的长期支持预期。

用于AI代理定制的新工具和数据

除了新模型,英伟达还发布了一系列训练数据集和最先进的强化学习库,用于构建专门的AI代理。

强化学习是这样一种训练AI模型的方法:它让模型置身于真实世界的各类问题、指令与任务当中。和依赖预先设定好的问答数据集的监督学习不一样,强化学习会把模型放在充满不确定性的环境里,借助奖励机制来强化那些成功的行动,同时对错误的行为施以惩罚。最终形成的,是一个能够在复杂且动态的条件下运作的推理系统,这个系统能通过主动获取的反馈来学习相关规则和界限。

新的数据集涵盖3万亿个全新的Nemotron预训练、后训练及强化标记,能够提供丰富的推理、编码与多步骤工作流实例。这些内容为构建高性能、领域专属的代理奠定了框架基础。与此同时,英伟达推出了Nemotron代理安全数据集——这是一个源自真实场景的遥测数据集,可助力各团队对复杂及多代理系统的安全性展开评估与强化。

在此基础上,英伟达推出了NeMo Gym与NeMo RL这两个开源库。其中,Gym负责提供训练环境,RL则为Nemotron模型的后训练筑牢基础。开发者能够将二者结合运用,以此作为开发的脚手架,借助RL训练循环来运行模型,从而加快开发进程,同时实现与现有训练环境的互操作。

开源Nemotron模型和数据集的发布进一步巩固了英伟达对更广泛AI生态系统的影响。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表本站立场。文章及其配图仅供学习分享之用,如有内容图片侵权或者其他问题,请联系本站作侵删。
  • 最新文章