in

AWS Trasforma il Cloud: Nuovi Server e Architetture per Agenti Autonomi

AWS introduce progressi significativi per ottimizzare l'infrastruttura cloud dedicata all'intelligenza artificiale e migliorare l'efficienza operativa.

aws trasforma il cloud nuovi server e architetture per agenti autonomi 1764738709

Nel recente keynote di apertura, il CEO di AWS, Matt Garman, ha illustrato una visione innovativa centrata sugli agenti operativi. Per implementare milioni di questi agenti nei sistemi aziendali, è necessario ripensare completamente l’infrastruttura esistente. La seconda fase di annunci del re:Invent si concentra su aspetti fondamentali della tecnologia: chip, server, networking, strati di dati e sicurezza, stabilendo così una base solida per supportare il reasoning, la multimodalità e l’automazione avanzata.

Aggiornamenti tecnologici dello stack AWS

AWS ha intrapreso un vasto processo di aggiornamento per tutti gli strati della propria architettura, inclusi compute, networking, storage, database e servizi avanzati. Questo passo rappresenta un’evoluzione significativa verso una piattaforma in grado di gestire modelli di intelligenza artificiale più complessi e autonomi, garantendo il rispetto dei requisiti di governance e prestazioni.

Il lancio di Trainium3 UltraServers

Un importante punto di riferimento è stato il lancio dei Trainium3 UltraServers, progettati per accelerare l’addestramento e l’inferenza dei modelli di intelligenza artificiale nel cloud. Questo nuovo chip, costruito con un processo a 3 nm, promette prestazioni fino a 4.4 volte superiori, una maggiore efficienza energetica di 4 volte e una larghezza di banda di memoria quasi quadrupla rispetto alla generazione precedente. Ciascun UltraServer integra 144 chip Trainium3, raggiungendo oltre 362 PFLOPS in FP8.

In aggiunta, la nuova rete di infrastruttura riduce la latenza tra chip a meno di 10 microsecondi, consentendo un addestramento efficace di modelli di grandi dimensioni e una gestione di carichi di lavoro che richiedono un intenso scambio di informazioni, come gli agenti multimodali e la generazione video in tempo reale.

Collaborazioni strategiche e nuove istanze GPU

A fianco dei chip proprietari, AWS ha ampliato la sua collaborazione con NVIDIA, introducendo le nuove Amazon EC2 P6e-GB300 UltraServers. Queste istanze GPU, basate sull’architettura NVIDIA GB300 NVL72, rappresentano le più potenti mai realizzate su AWS, destinate a gestire modelli con trilioni di parametri e carichi di lavoro complessi.

La loro progettazione ottimizzata per i modelli conversazionali e multimodali ad alta intensità di calcolo offre una combinazione imbattibile di memoria e capacità di calcolo. Questi UltraServers si appoggiano sul AWS Nitro System, garantendo prestazioni stabili e un’integrazione perfetta con i servizi containerizzati come EKS.

Applicazioni pratiche

Le applicazioni immediate di queste innovazioni spaziano dalla ricerca scientifica alle simulazioni fisiche, fino alla generazione di contenuti video e ambienti multi-agente ad alta intensità computazionale.

Inoltre, AWS ha presentato le AWS AI Factories, strutture dedicate all’intelligenza artificiale installate nei data center dei clienti, progettate, integrate e gestite direttamente da AWS.

Innovazioni nel data layer e miglioramenti della sicurezza

In un’ottica di supporto a agenti e modelli sempre più complessi, AWS ha ristrutturato in profondità anche Amazon S3. Tra le novità, spicca il debutto di S3 Vectors, che integra capacità native per i vettori direttamente all’interno di S3, supportando fino a due miliardi di vettori per indice e fino a 20 trilioni per bucket, con prestazioni tre volte superiori e un abbattimento dei costi fino al 90% rispetto ad altre soluzioni.

Le dimensioni massime degli oggetti sono state aumentate da 5 TB a 50 TB, rispondendo alle esigenze di dataset sempre più grandi, come quelli video e scientifici.

Inoltre, le S3 Batch Operations sono diventate fino a dieci volte più rapide, facilitando le migrazioni di massa e i processi di governance.

Infine, AWS ha aggiornato la propria offerta di sicurezza con GuardDuty Extended Threat Detection, che estende la protezione a EC2 ed ECS, correlando automaticamente eventi critici per una gestione efficiente delle minacce.

AWS ha intrapreso un vasto processo di aggiornamento per tutti gli strati della propria architettura, inclusi compute, networking, storage, database e servizi avanzati. Questo passo rappresenta un’evoluzione significativa verso una piattaforma in grado di gestire modelli di intelligenza artificiale più complessi e autonomi, garantendo il rispetto dei requisiti di governance e prestazioni.0

What do you think?

Scritto da Staff

spionaggio nel regno unito le criticita nelle indagini e le loro conseguenze 1764735022

Spionaggio nel Regno Unito: Le Criticità nelle Indagini e le Loro Conseguenze