
NVIDIA近日推出了专为大规模自主智能代理运行设计的开源模型——NVIDIA Nemotron 3 Super。
该模型拥有1200亿参数,其中活跃参数达到120亿,专注于支持复杂的智能代理AI系统的大规模执行。通过优化长上下文处理和复杂推理能力,Nemotron 3 Super能够将智能代理AI的吞吐量提升最多5倍。
NVIDIA指出,随着AI代理的广泛应用,向多代理系统转变会带来诸如上下文爆炸(生成的令牌数量是普通聊天的15倍)和思考延迟(导致运行速度变慢,影响实用性)等挑战。Nemotron 3 Super通过配备100万令牌的上下文窗口,有效解决了这些问题。
目前,Perplexity已向用户开放该模型的访问权限。此外,提供软件开发智能代理的企业如CodeRabbit、Factory、Greptile,以及生命科学和前沿AI领域的公司如Edison Scientific、Lila Sciences等,均已开始采用该模型。


