DeepSeek ha rilasciato in anteprima V4, il nuovo modello linguistico open source con licenza MIT che raccoglie l’eredità di V3.2 e di R1, i modelli che tanto avevano sorpreso l’anno scorso. Arriva in due versioni, Flash e Pro, entrambe con architettura Mixture-of-Experts (MoE) e finestra di contesto da 1 milione di token.
La versione Pro ha 1600 miliardi di parametri totali, con 49 miliardi attivi per richiesta (è la caratteristica dell’architettrura MoE portata alla ribalta proprio da DeepSeek nel 2025). Flash scende a 284 miliardi, con 13 miliardi attivi. DeepSeek sostiene che V4 riduce i costi di inferenza e migliori soprattutto nei compiti agentici, nel codice e nel ragionamento.
Il confronto resta però da prendere come dichiarazione della società cinese. DeepSeek parla di risultati vicini ai modelli frontier e di prestazioni paragonabili a GPT-5.4 in alcuni benchmark di programmazione, ma ammette anche un ritardo nei test di conoscenza rispetto ai modelli più recenti di OpenAI e Google.
Gli sviluppatori dichiarano una distanza di massimo 6 mesi dallo stato dell’arte dei rivali, che per gli standard di evoluzione attuali può essere considerato un distacco notevole.
Tuttavia, bisogna anche e soprattutto considerare il prezzo con il quale DeepSeek distribuisce i suoi modelli via API. V4 Flash costa 0,14 dollari per milione di token in input e 0,28 dollari in output. V4 Pro sale a 0,145 dollari in input e 3,48 dollari in output, restando molti al di sotto dei concorrenti closed.
Per dare un riferimento prendendo il più nuovo e costoso dei modelli rivalli chiusi, GPT-5.5 Pro costa 30 dollari per milione di token in input e 180 dollari per milione di token in output.
Il modello, almeno per ora, lavora solo su testo. Huawei ha detto che i suoi cluster Ascend possono supportarlo, ma resta da capire quanto hardware cinese sia stato usato nell’addestramento.
La disponibilità su chip nazionali resta uno degli aspetti più rilevanti per Pechino, che cerca di ridurre la dipendenza da Nvidia mentre i controlli statunitensi limitano l’accesso ai chip AI più avanzati.
È anche il punto richiamato indirettamente da Jensen Huang nell’intervista con Dwarkesh Patel diventata ormai celebre per la frase “We’re not a car!” di Huang.
“You’re not talking to somebody who woke up a loser”
Jensen Huang on why @nvidia is not going to lose to the competition in the Chinese market.
“We are not a car.” “These ecosystems these ecosystems are hard to replace. ” pic.twitter.com/vQPv8jk6Fj
— AI:AM (@AI_in_the_AM) April 15, 2026
Nvidia, secondo il suo amministratore delegato, non è un prodotto sostituibile come un’auto, ma una piattaforma di calcolo fatta di chip, CUDA, librerie e sviluppatori. Per Huang, non è possibile dare alla Cina la tecnologia più avanzata, che deve rimanere in mano agli Stati Uniti, tuttavia escludere la Cina da questo ambiente rischia però di accelerare lo spostamento verso alternative casalinghe, proprio ciò che Pechino cerca con Ascend e con modelli come DeepSeek V4.