DeepSeek V4, Pro e Flash: modello open source con finestra da un milione di token

DeepSeek ha messo in anteprima la sua quarta generazione di modelli con un annuncio che unisce numeri impressionanti a una chiara scelta strategica: pubblicare i pesi e offrire due configurazioni distinte per usi diversi. La novità principale è la capacità di gestire fino a 1 milione di token di contesto, un elemento che cambia le aspettative su quanto un modello possa mantenere coerenza in conversazioni o documenti molto lunghi. Questo rilascio arriva dopo il successo di V3, che aveva già fatto parlare di sé per il rapporto prezzo/prestazioni.

La preview di V4 è pensata come un rollout graduale: DeepSeek cerca feedback reale prima di un lancio più ampio, mantenendo al contempo i modelli disponibili per la sperimentazione. L’azienda rende pubblici i file dei modelli per permettere a ricercatori e imprese di scaricarli, ospitarli e adattarli, riducendo la dipendenza dalle API dei grandi fornitori chiusi.

Cosa offre la lineup V4

La famiglia DeepSeek V4 comprende due anime: il modello Pro e il modello Flash, progettati per bilanciare potenza e costo operativo. Il Pro è una rete di tipo Mixture of Experts (MoE) con un totale di 1,6 trilioni di parametri, ma attiva circa 49 miliardi di parametri per singola inferenza: un approccio che consente di attingere a un bacino enorme mantenendo sotto controllo il consumo computazionale. Il Flash, più compatto, arriva a 284 miliardi di parametri totali con circa 13 miliardi attivi, offrendo tempi di risposta più rapidi e costi API inferiori.

Prestazioni e casi d’uso

Secondo le valutazioni condivise da DeepSeek, il Pro eccelle in compiti di matematica, STEM e coding, e si posiziona vicino ai migliori modelli chiusi in termini di prestazioni generali, restando tuttavia leggermente dietro a modelli come Gemini 3.1 Pro per conoscenza enciclopedica.

Il Flash si avvicina alle prestazioni di ragionamento del Pro e si dimostra molto efficace per attività agentiche semplici, rendendolo una scelta pratica per implementazioni che richiedono efficienza e costi contenuti.

Architettura, formati e modalità d’uso

V4 integra innovazioni architetturali pensate per migliorare il ragionamento e la scalabilità: la scelta del MoE è centrale perché permette di disaccoppiare il numero totale di parametri da quelli effettivamente attivati a runtime. I modelli supportano modalità diverse sul sito di DeepSeek, come Instant Mode ed Expert Mode, che facilitano sia l’uso immediato sia la sperimentazione avanzata. I pesi sono distribuiti in formati a bassa precisione come FP8 e combinazioni FP4+FP8 per ridurre l’occupazione di memoria senza sacrificare troppo la qualità.

Distribuzione e requisiti

Nonostante il rilascio open, le esigenze hardware restano significative per chi vuole eseguire localmente il Pro, soprattutto se si sfruttano le modalità che richiedono contesti estesi. Alcuni report indicano test con hardware di fornitori locali, mentre il mercato guarda con interesse ai legami con chip nazionali per aggirare le restrizioni sull’esportazione di componenti esteri. Per molti sviluppatori la via più semplice è utilizzare l’interfaccia web su chat.deepseek.com o scaricare i modelli da repository pubblici per l’hosting su piattaforme come Hugging Face e ModelScope.

Open source, licenza e impatto sul mercato

Un punto cruciale del rilascio è la scelta di rendere i pesi pubblici: questo consente a startup, università e grandi aziende di studiare, adattare e distribuire V4 senza vincoli API.

La strategia è coerente con la filosofia che ha reso popolari le precedenti versioni di DeepSeek e contribuisce a creare un ecosistema competitivo in cui l’accesso a modelli avanzati non è appannaggio esclusivo di pochi attori chiusi. La presenza di due tagli di modello permette inoltre di coprire una platea più ampia di utenti, dal ricercatore che necessita di massima capacità al team di prodotto che privilegia costi e tempi di risposta.

In sintesi, DeepSeek V4 rappresenta un passo importante nella maturazione dell’offerta open source: combina una finestra di contesto molto ampia, un’architettura efficiente e la disponibilità dei pesi, imponendosi come alternativa concreta per chi cerca modelli potenti e flessibili. Il rilascio in preview e la richiesta di feedback indicano che il prodotto continuerà a evolvere in base all’adozione reale e alle esigenze della community.