Skip to content Skip to footer

Gemini 2.5 Pro: un nuovo standard nel ragionamento artificiale

Il 25 marzo 2025, Google ha annunciato Gemini 2.5 Pro Experimental, il suo modello di intelligenza artificiale più avanzato. Si tratta di un’evoluzione progettata per affrontare compiti complessi attraverso un nuovo approccio al ragionamento, che integra una fase di riflessione interna prima della generazione delle risposte. Questo modello segna un progresso significativo non solo in termini di accuratezza, ma anche di qualità cognitiva nell’elaborazione delle informazioni.

Nei principali benchmark di valutazione, Gemini 2.5 Pro mostra prestazioni solide e costanti. Sul test Humanity’s Last Exam, pensato per misurare la capacità di ragionamento senza strumenti esterni, raggiunge un punteggio del 18,8%, nettamente superiore rispetto a modelli come GPT-4.5 o Claude. In ambito scientifico ottiene l’84% nel benchmark GPQA, mentre in matematica registra un 92% su AIME 2024 e l’86,7% su AIME 2025. L’equilibrio tra risultati elevati e coerenza nei diversi domini suggerisce una maturità architetturale e un affinamento notevole nel post-training.

L’attenzione al codice è un altro punto centrale. Gemini 2.5 Pro eccelle nelle attività di generazione, modifica e analisi del codice, come dimostrano i risultati su benchmark come SWE-bench Verified (63,8%) e Aider Polyglot (74%). È in grado di interpretare prompt sintetici e tradurli in soluzioni operative anche complesse, dimostrando una comprensione approfondita del contesto. La capacità di gestire fino a un milione di token come finestra di contesto, destinata a raddoppiare, permette al modello di analizzare e sintetizzare grandi volumi di dati provenienti da fonti eterogenee, inclusi testo, immagini, audio e video.

Gemini 2.5 Pro è attualmente disponibile in Google AI Studio e nell’app Gemini per gli utenti avanzati, con un rilascio previsto anche su Vertex AI. La direzione intrapresa da Google, con modelli dotati di capacità riflessive native, apre una nuova fase nell’intelligenza artificiale: meno orientata alla performance isolata, più focalizzata sulla capacità del sistema di sostenere il ragionamento nei contesti complessi.