Con l’introduzione del nuovo controllo di “reasoning” per il modello Gemini 2.5 Flash, Google punta a risolvere una delle sfide emergenti dell’intelligenza artificiale: l’eccessivo dispendio di risorse per attività semplici. Il sistema, annunciato il 17 aprile, consente agli sviluppatori di limitare quanta potenza di calcolo viene dedicata al processo di ragionamento dell’AI, ottimizzando i costi e l’impatto ambientale.
Il problema, spiega Tulsee Doshi di Google, è che i modelli tendono a “pensare troppo”, anche quando la richiesta è banale. L’analogia è chiara: come usare un macchinario industriale per rompere una noce. Il nuovo “thinking budget” consente di regolare il livello di ragionamento da zero fino a 24.576 token, dando ai team la possibilità di calibrare il comportamento dell’AI in base all’applicazione.
L’iniziativa segna un cambio di paradigma. Dopo anni di competizione sulla dimensione dei modelli e la quantità di parametri, l’industria comincia a orientarsi verso l’efficienza. Secondo Jack Rae di DeepMind, trovare il livello “perfetto” di reasoning resta complesso, ma il controllo fine rappresenta una svolta utile per ambienti in cui precisione e costi sono cruciali – come coding, finanza o sanità.
Anche l’aspetto ambientale è centrale. Il consumo energetico legato all’inferenza AI sta superando quello della fase di training. Il nuovo sistema di Google potrebbe contribuire a ridurre l’impronta ecologica, evitando loop infiniti e calcoli inutili.
In un contesto in cui anche modelli open source come DeepSeek R1 avanzano rapidamente, Google rilancia sull’efficienza e sulla personalizzazione. La novità introduce una visione più sostenibile e razionale dell’intelligenza artificiale del futuro.
L’articolo Google, col nuovo aggiornamento Gemini 2.5 sarà più efficiente e meno dispendioso proviene da Futuratech.