Quando un’azienda riesce davvero a spiazzarci in positivo, vale la pena fermarsi e capire cosa è successo. Con Devstral 2 Small e Devstral 2 Large, Mistral ci è riuscita. Ha rilasciato due modelli specializzati nel coding in modalità agentica e, soprattutto, ha riportato al centro della scena qualcosa che sembrava superato: un modello denso da 123 miliardi di parametri.
Un gesto quasi controcorrente, in un’epoca dominata dai MoE. Eppure funziona.
1. Perché Devstral è una release significativa
Il punto è semplice: Devstral Large ottiene circa il 72,5% sui benchmark Verified per software development, superando DeepSeek 3.2.
In uno studio indipendente commissionato da Mistral, gli esperti hanno confrontato output di Devstral con:
-
DeepSeek 3.2 → Devstral preferito nella maggior parte dei casi
-
Claude Sonnet 4.5 → parità nel 25%, Sonnet preferito nel 50%, Devstral nel 25%
Il risultato chiave?
Devstral è competitivo con Sonnet 4.5 pur essendo molto più piccolo, molto più economico e pensato specificamente per il coding agentico.
E questo apre una domanda inevitabile: com’è possibile che un modello così “piccolo” tenga testa ai giganti?
La risposta arriva quando entriamo nel cuore dell’architettura.
2. Modelli densi vs modelli MoE: cosa cambia davvero
Modelli densi: tutto il cervello lavora sempre
Un modello denso (dense) attiva tutti i suoi parametri ad ogni token generato.
Questo significa:
-
più coerenza interna
-
meno rumore nei percorsi di attivazione
-
addestramento complesso ma stabile
-
performance prevedibili
Nel caso di Devstral, i suoi 123B parametri sono sempre attivi. Non c’è selezione, non ci sono “esperti” da scegliere: il modello “pensa” sempre al massimo della sua capacità.
Modelli MoE: tanti piccoli esperti, mai tutti insieme
Un modello Mixture of Experts funziona diversamente:
-
contiene numerosi “blocchi” specializzati
-
a ogni passaggio solo pochi di essi vengono attivati
-
il numero totale di parametri è enorme (es. DeepSeek 600B+), ma solo una frazione lavora per token
-
il gating system decide quali “esperti” usare
Vantaggi:
-
costi di inferenza molto più bassi rispetto a un modello denso dello stesso “peso totale”
-
scalabilità estrema
Svantaggi:
-
addestramento fragile
-
instabilità nei percorsi di attivazione
-
qualità non sempre uniforme
-
tuning più delicato
3. Perché un modello denso può battere un MoE molto più grande
Devstral è un caso interessante perché sfida un presupposto degli ultimi due anni:
“Oltre i 100 miliardi, i modelli densi sono morti.”
Il modello di Mistral dimostra il contrario.
Perché?
-
La stabilità di un denso permette un addestramento più preciso.
Meno sorprese, meno divergenze, meno fallimenti negli expert pathways. -
Nel coding agentico la coerenza conta più della capacità teorica.
I MoE brillano nel generalismo vasto; i densi brillano nel rigore. -
Sotto i 150–200B, il rapporto costi/benefici torna competitivo.
Il modello non è “troppo grande” per diventare ingestibile. -
L’ottimizzazione verticale (solo coding) amplifica il potenziale.
È un modello che sa fare una cosa bene, sempre.
Questo spiega perché Devstral 123B riesce a stare vicino a Sonnet e davanti a DeepSeek 3.2, pur avendo una scala radicalmente inferiore.
4. Contesto tecnico: finestra di contesto, licenze, deployment
Finestra di contesto: 256k token
Un valore che oggi comincia a diventare standard, ma che resta notevole se:
-
mantiene stabilità
-
non perde dettagli nelle parti centrali
-
gestisce correttamente lunghi percorsi di ragionamento
Licenze: Apache 2.0 per lo Small, MIT modificata per il Large
-
Devstral 24B → uso commerciale illimitato
-
Devstral 123B → MIT modificata: gratuito fino a 20M$/anno se venduto come SaaS
Una scelta furba: una licenza leggera da modificare, con clausole minime.
Deployment
-
Il 123B richiede molta RAM (128 GB per 4–6 bit) e risulta lento: densità = peso computazionale
-
I GGUF arriveranno, ma non ci si deve aspettare velocità elevate
Differenza di qualità nei benchmark coding:
-
Devstral 123B ≈ 72,5%
-
Devstral 24B ≈ 67–68%
Questi 4–5 punti sono la linea che separa “funziona” da “risolve problemi difficili”.
5. Perché questa release è un messaggio politico oltre che tecnico
Mistral è una delle poche aziende europee che riesce a giocarsela alla pari con Stati Uniti e Cina.
Devstral è la prova che:
-
l’Europa può produrre modelli competitivi
-
non serve inseguire solo la scala
-
esiste ancora spazio per architetture alternative
E non è un caso che il modello sia offerto via API gratuitamente per un periodo, a un costo finale di 1/7 del prezzo di Claude Sonnet 4.5.
Il messaggio è chiaro: il mercato del coding agentico sta per cambiare.
----
Mistral Vibe CLI: Come Usare Devstral per il Coding Avanzato
Mistral Vibe CLI è uno strumento rivoluzionario per sviluppatori, progettato per integrare l’intelligenza artificiale di Devstral, il modello di Mistral AI specializzato per il coding. Questo strumento consente di automatizzare, generare e ottimizzare il codice direttamente dal terminale, migliorando la produttività e riducendo gli errori.
Installazione e Configurazione
Per iniziare, assicurati di avere un ambiente Unix-like (Linux, macOS o WSL 2 su Windows). Installa Mistral Vibe CLI con il comando:
bashcurl -LsSf https://mistral.ai/vibe/install.sh | bash
Dopo l’installazione, aggiungi ~/.local/bin al tuo PATH modificando il file ~/.bashrc con:
bashexport PATH="$HOME/.local/bin:$PATH"
Poi ricarica il file con source ~/.bashrc.
Utilizzo di Devstral
Mistral Vibe CLI utilizza Devstral come modello predefinito. Puoi verificare la configurazione nel file ~/.vibe/config.toml, dove dovresti trovare:
tomlactive_model = "devstral-2"
Avvia Mistral Vibe con il comando vibe. Ora puoi interagire con Devstral per generare codice, refactoring, o analizzare progetti. Ad esempio, puoi chiedere:
Crea una funzione Python per calcolare il fattoriale di un numero.
Mistral Vibe risponderà con una soluzione pronta all’uso, sfruttando le capacità avanzate di Devstral.
Vantaggi
Mistral Vibe CLI offre un’interfaccia intuitiva e potenti funzionalità di automazione, rendendo Devstral accessibile direttamente dal terminale. Questo strumento è ideale per sviluppatori che cercano di ottimizzare il loro flusso di lavoro, riducendo i tempi di sviluppo e migliorando la qualità del codice.
Con Mistral Vibe CLI e Devstral, il coding diventa più intelligente, veloce e accessibile a tutti.