Gemini Deep Think, a differenza del “fratello” di ChatGpt, ha partecipato ufficialmente alle competizioni. Potremmo trovarci a un passo dal risolvere problemi di matematica fino a ora irrisolti da noi umani

Adesso i modelli di intelligenza artificiale competono con gli studenti di scuola superiore alle olimpiadi di matematica, e vincono pure. Sia Google sia OpenAI, infatti, hanno reclamato la medaglia d’oro per essere riusciti a risolvere cinque sui sei quesiti presentati dal comitato delle Olimpiadi Internazionali di Matematica ai giovani partecipanti.
Se dovessimo scegliere la vincitrice fra le due aziende sulla base di chi ha reclamato per prima la vittoria, allora potremmo dire che il modello di OpenAI è al primo posto. In un messaggio pubblicato su X, il ricercatore Alexander Wei ha segnalato per primo l’eccellente risultato del “fratello” di ChatGpt: «Sono felice di condividere che il nostro large language model “pensante” ha superato la più grande sfida per l’AI: la medaglia d’oro nella più prestigiosa competizione matematica del mondo».

Ma OpenAI non era registrata alle competizioni. A differenza di Google e del suo modello ragionante DeepMind, che per il secondo anno di fila ha partecipato ufficialmente alla gara (l’anno scorso si era qualificata per una medaglia d’argento). «Quest’anno abbiamo fatto parte di una coorte inaugurale in cui i risultati dei nostri modelli sono stati ufficialmente valutati e certificati dai coordinatori delle Olimpiadi internazionali di matematica secondo gli stessi criteri utilizzati per le soluzioni degli studenti», ha scritto il team in una comunicazione ufficiale. Nessuno dei due modelli, insomma, si è messo in competizione diretta con gli studenti (umani) che hanno partecipato alla gara, ma vincere le olimpiadi di matematica rimane comunque una cartina di tornasole per capire a che punto sono arrivati i large language models nei ragionamenti complessi e non solo nella generazione di testi.



















































Vincere usando il linguaggio naturale

Come abbiamo detto, entrambi i modelli hanno risolto cinque problemi, rimanendo nei limiti delle 4.5 ore di gara ed essendo valutati con gli stessi criteri che il comitato olimpico usa per gli esseri umani. E proprio in virtù di questo il modello di Google —  chiamato Gemini Deep Think — potrà ricevere una certificazione ufficiale dei propri successi.
A differenza degli altri modelli di AI “in gara” realizzati da aziende minori, che hanno dovuto ricevere la versione “tradotta” delle domande espresse in linguaggio umano, per quelli di OpenAI e Google non c’è stato bisogno di un intermediario e hanno potuto “agire” in autonomia dall’inizio alla fine. Il successo quindi è doppio: non solo in termini di ragionamento e capacità di risolvere problemi complessi, ma anche di comprendere e interpretare i problemi di matematica senza interventi umani. Secondo Junehyuk Jung, professore di matematica alla Brown University e ricercatore ospite dell’unità DeepMind AI di Google, si tratta di un passo in avanti che potrebbe avvicinarci sempre di più al giorno in cui le intelligenze artificiali saranno capaci di risolvere problemi di matematica avanzata fino a ora irrisolti da noi esseri umani.

Perdere alle competizioni di hacking

Non sono solo vittorie. La settimana scorsa OpenAI ha chiuso una gara simile con una sconfitta. Ma di pochissimo. Stiamo parlando delle AtCoder World Tour Finals 2025 Heuristic, un nome lunghissimo per indicare una competizione di hacking che si è tenuta a Tokyo e da cui è uscito vincitore un giovane sviluppatore polacco, Przemysław “Psyho” Dębiak. «L’umanità ha prevalso (per ora!)», ha scritto il vincitore su X. «Sono completamente esausto… Sono a malapena vivo».

La competizione prevedeva un unico problema di ottimizzazione da svolgersi in 600 minuti. Alla fine della gara, lo sviluppatore ha vinto con un distacco di appena il 9,5% rispetto al modello (non disponibile per il pubblico) di OpenAI. Una medaglia d’argento per OpenAIAHC, quindi, guadagnata con il sudore dei circuiti e dei processori, che potrebbe anticipare una vittoria per l’anno prossimo, com’è successo a Google con le Olimpiadi di matematica.

Per non perdere le ultime novità su tecnologia e innovazione
iscriviti alla newsletter di Login

22 luglio 2025 ( modifica il 23 luglio 2025 | 11:31)