Google ha annunciato il lancio di Gemini 2.5, una nuova generazione di modelli di intelligenza artificiale progettati per migliorare il ragionamento e l’elaborazione delle informazioni prima di fornire una risposta.
Disponibilità e accesso
Il primo esponente di questa nuova famiglia di modelli è Gemini 2.5 Pro Experimental, un’IA multimodale avanzata che Google definisce il suo modello più sofisticato fino a oggi. Questo modello sarà disponibile a partire da martedì su Google AI Studio, la piattaforma per sviluppatori dell’azienda, e nell’app Gemini per gli utenti del piano premium Gemini Advanced, al costo di 20 dollari al mese.
Il futuro dell’IA secondo Google
Secondo Google, tutte le future versioni dei suoi modelli di intelligenza artificiale integreranno capacità di ragionamento avanzate.
La competizione nel settore AI
Dallo scorso settembre, quando OpenAI ha introdotto il suo primo modello di IA con capacità di ragionamento, denominato o1, il settore tecnologico ha intensificato la competizione per sviluppare modelli sempre più sofisticati. Oggi, aziende come Anthropic, DeepSeek, Google e xAI hanno tutti modelli che sfruttano maggiore potenza computazionale e tempo extra per verificare le informazioni e ragionare sui problemi prima di generare una risposta.
Progressi in matematica e programmazione
Queste tecniche hanno permesso ai modelli di intelligenza artificiale di ottenere risultati significativi in ambiti come la matematica e la programmazione. Molti esperti ritengono che il ragionamento avanzato sarà un elemento chiave per la prossima generazione di agenti IA autonomi, in grado di eseguire compiti con minima supervisione umana. Tuttavia, tali modelli comportano anche costi più elevati.
Evoluzione dei modelli di Google
Google aveva già sperimentato l’integrazione del ragionamento nei suoi modelli AI, rilasciando una versione “pensante” di Gemini lo scorso dicembre. Tuttavia, Gemini 2.5 rappresenta il più ambizioso tentativo dell’azienda di competere con la serie “o” di OpenAI.
Prestazioni nei benchmark
L’azienda afferma che Gemini 2.5 Pro supera i suoi precedenti modelli di frontiera e molte delle soluzioni concorrenti in diversi test di riferimento. In particolare, il modello è stato ottimizzato per eccellere nella creazione di applicazioni web visivamente accattivanti e nella programmazione agentica.
Risultati nei test di programmazione
In una valutazione denominata Aider Polyglot, che misura le capacità di editing del codice, Gemini 2.5 Pro ha raggiunto un punteggio del 68,6%, superando i principali modelli di OpenAI, Anthropic e DeepSeek. Tuttavia, in un altro test, SWE-bench Verified, che valuta le capacità di sviluppo software, ha ottenuto un punteggio del 63,8%, superando o3-mini di OpenAI e R1 di DeepSeek, ma restando al di sotto di Claude 3.7 Sonnet di Anthropic, che ha ottenuto il 70,3%.
Prestazioni nei test multimodali
Nel test multimodale denominato Ultimo Esame dell’Umanità, composto da domande di matematica, discipline umanistiche e scienze naturali, Gemini 2.5 Pro ha ottenuto un punteggio del 18,8%, superando la maggior parte dei modelli concorrenti.
Capacità di elaborazione
Per quanto riguarda la capacità di elaborazione, Gemini 2.5 Pro verrà inizialmente rilasciato con una finestra di contesto di 1 milione di token, permettendo al modello di gestire fino a circa 750.000 parole in un’unica sessione. Per fare un paragone, questa capacità supera la lunghezza dell’intera trilogia de “Il Signore degli Anelli”. Inoltre, Google prevede di raddoppiare presto la lunghezza di input supportata, portandola a 2 milioni di token.
Prezzi e disponibilità di Google
Al momento, Google non ha ancora reso pubblici i prezzi dell’API per Gemini 2.5 Pro, ma ha dichiarato che fornirà maggiori dettagli nelle prossime settimane.
L’articolo Google lancia Gemini 2.5, la nuova IA con migliorie proviene da Futuratech.