All’evento GTC 2026 NVIDIA ha messo al centro dell’annuncio l’evoluzione verso agenti AI capaci di operare in autonomia su compiti complessi. Queste piattaforme non ricevono più singoli prompt, ma missioni complete da pianificare, eseguire e monitorare. Per supportare questo salto, l’azienda ha presentato una suite che unisce modelli, strumenti di sviluppo e componenti infrastrutturali pensati per rendere gli agenti affidabili, osservabili e soprattutto sicuri.
Un nuovo stack per agenti: Agent Toolkit e Nemotron
Il fulcro software delle novità è il Agent Toolkit, una raccolta di modelli open, blueprint e runtime destinati alla costruzione e alla valutazione di agenti autonomi di lunga durata. Al suo interno trovano posto i modelli Nemotron — ottimizzati per ragionamento, programmazione, visione e speech — insieme a componenti come NeMo per profiling e personalizzazione, NIM per l’inferenza e Dynamo per la scalabilità dei carichi.
Tra le funzionalità emergenti c’è COOP, un modulo pensato per tradurre problemi di ottimizzazione espressi in linguaggio naturale in strategie risolutive eseguibili dagli agenti.
Progettare agenti robusti e modulari
Il design del toolkit favorisce la modularità: sviluppatori e team possono combinare coding agent con modelli locali come i Nemotron, oppure orchestrare più agenti per workflow articolati. L’approccio mira a fornire blueprint ripetibili per scenario enterprise, dalla scrittura di codice all’automazione di processi, rendendo più rapido il passaggio da prototipo a deployment.
OpenShell e NemoClaw: sicurezza e OpenClaw in un’unica soluzione
Un punto critico degli agenti autonomi è l’accesso a dati sensibili e servizi esterni. Per questo NVIDIA ha introdotto OpenShell, un runtime open source che crea un ambiente isolato per gli agenti, applicando policy di rete, controlli di accesso e protezioni della privacy.
OpenShell funge da strato di guardrail, prevenendo escalation di privilegi e accessi non autorizzati, e permette di Eseguire agenti con maggior garanzia di conformità operativa.
NemoClaw: integrazione con OpenClaw e approccio ibrido
In parallelo è arrivato NemoClaw, l’implementazione NVIDIA per l’ecosistema OpenClaw, nata in collaborazione con la comunità guidata da Peter Steinberger. NemoClaw consente l’installazione combinata di OpenClaw, modelli Nemotron e il runtime OpenShell via un singolo comando, creando un ambiente pronto all’uso che include anche un privacy router. Questo componente abilita un funzionamento ibrido: gli agenti possono eseguire modelli in locale e, quando necessario, invocare risorse di frontiera in cloud preservando controlli di privacy e governance.
Hardware per agenti always-on: DGX Spark e DGX Station
Sul fronte hardware NVIDIA ha aggiornato le linee pensate per l’esecuzione locale di agenti. DGX Spark è stato ottimizzato attorno al Superchip GB10 Grace Blackwell con Tensor Core Blackwell e supporto al formato dati FP4, raggiungendo picchi dichiarati fino a un petaflop in FP4, utili per gestire prompt estesi e richieste concorrenti. DGX Spark ora supporta cluster fino a quattro sistemi con interconnessioni ConnectX a 200 GbE, facilitando topologie scalabili per carichi agentici paralleli.
DGX Station: potenza datacenter sulla scrivania
Per chi necessita di capacità ancora maggiori, la nuova DGX Station porta sul desktop il Superchip GB300 Grace Blackwell Ultra, combinando due GPU Blackwell, 288 GB di HBM3E e collegamenti NVLink-C2C a 900 GB/s a una CPU Grace con 72 core.
La piattaforma dichiara fino a 20 PetaFLOPS in FP4 (con sparsity) e può ospitare modelli di dimensioni estremamente grandi, con supporto per contesti fino a 1 milione di token e compatibilità con tool diffusi come Docker, Red Hat, Ollama e Weights & Biases.
L’insieme di innovazioni software e hardware disegnato da NVIDIA delinea un’infrastruttura completa per l’adozione su scala degli agenti AI: dal toolkit di sviluppo ai runtime di sicurezza, fino alle workstation che consentono di mantenere dati e inferenza in locale. Sebbene l’hardware richieda considerazioni energetiche e costi elevati, l’approccio ibrido di NemoClaw e il focus su policy e isolamento con OpenShell puntano a rendere l’esecuzione degli agenti simultaneamente più potente e più prudente.

