英伟达开源智能体工具包如何将企业查询成本压降逾50%
人工智能的竞争已从"能否生成内容"进阶到"能否自主行动"。英伟达近期正式推出英伟达智能体工具包(NVIDIA Agent Toolkit),并新增开源执行运行环境英伟达OpenShell,将安全策略、网络防护与隐私管控直接内嵌于自主智能体的部署层,打通了企业级智能体落地的Zui后一道门槛。
英伟达创始人兼首席执行官黄仁勋对此判断明确:"智能体正在将人工智能从生成与推理延伸至真实行动。员工将由一批的、专业化的、可个性化定制的智能体团队来赋能,而这些智能体由员工自己部署和管理。企业软件行业将演进为专业化智能体平台,IT行业也正站在新一轮大扩张的前夜。"
混合架构将查询成本压降逾50%
英伟达智能体工具包由四大核心组件构成:开源模型英伟达Nemotron、开源智能体框架英伟达AI-Q、开放技能库英伟达cuOpt,以及新推出的开放执行环境OpenShell。开发者可基于上述组件构建能够自主感知、推理、决策并执行的专业化人工智能智能体。
在性能层面,AI-Q采用"模型负责编排、Nemotron开放模型负责检索"的混合架构,可在保持精度的同时,将查询成本降低逾50%。英伟达基于AI-所构建的智能体,已在DeepResearch Bench及DeepResearch Bench II两项行业评测中取得Zui高排名。AI-Q内置评估系统,能够自动解释每一条人工智能响应的生成逻辑,有效提升可解释性与企业合规性。
OpenShell的推出则补上了安全短板。该运行环境在赋予自主智能体充分执行权限的同时,强制执行安全、网络与隐私策略。英伟达正与思科(Cisco)、CrowdStrike、谷歌、微软安全及趋势科技等主流网络安全厂商合作,推进OpenShell与各家网络安全及人工智能工具的兼容对接。
十六家头部软件厂商集体跟进
围绕英伟达智能体工具包,一批覆盖创意、工业、医疗、金融等赛道的软件巨头已相继宣布合作落地方案。Adobe将以智能体工具包为底座,运行面向创意、生产力与营销场景的混合长效智能体;Salesforce将在Agentforce中集成Nemotron模型,并以Slack作为智能体的主交互界面与编排层;SAP通过旗下Joule Studio将开放工具包引入业务技术平台,供客户与合作伙伴自定义业务智能体。
工业与半导体领域同样动作频频。西门子基于Nemotron推出Fuse EDA人工智能智能体,可在半导体与印刷电路板设计全流程中自主编排工作流;新思科技(Synopsys)与益华电脑(Cadence)分别围绕芯片设计场景构建多智能体框架与超级智能体,旨在提升复杂项目的工程效率。医疗科技企业艾昆纬(IQVIA)已在内部团队及客户环境中部署逾150个智能体,服务对象涵盖全球前20大制药公司中的19家。
IT服务与协作平台方面,Atlassian正将工具包融入Jira、Confluence等产品的Rovo人工智能策略;ServiceNow则以AI-和Nemotron模型为核心,构建自主人工智能专家劳动力体系;开源框架生态重要玩家LangChain(累计下载量逾10亿次)亦宣布与英伟达深度整合,目标是在规模化场景下运行企业级高精度智能体。
本地部署与云端并行,覆盖多种基础设施形态
OpenShell支持多种部署形态,开发者可通过GitHub下载,在搭载英伟达GeForce RTX或英伟达RTX显卡的个人电脑、工作站及英伟达DGX Station、DGX Spark超级计算机上本地运行;主流硬件供应商华硕、戴尔、联想、惠普、技嘉、微星及超微均已列入支持名单。
在云端,企业可选择亚马逊云(AWS)、谷歌云、微软Azure及甲骨文云基础设施等平台构建人工智能工厂,配合思科、戴尔、慧与(HPE)、联想、超微的服务器硬件灵活扩容。
此次英伟达以开源策略为切入点,构建起"模型—智能体—技能—执行环境"的完整开放生态,对国内人工智能基础设施企业及应用开发商而言,既是可资借鉴的技术路径,也是值得警惕的生态卡位动作。尤其是混合架构在降本增效上的量化验证、安全运行环境与主流网络安全厂商的深度绑定,以及跨行业头部客户的批量背书,正在快速拉高企业级智能体的行业基准门槛。国内厂商如何在开放生态与自主可控之间找到平衡,将是接下来必须直面的竞争命题。