Google ogłosił, że „zaawansowana wersja Gemini Deep Think” osiągnęła wydajność na poziomie złota na międzynarodowym olimpiadzie matematycznym (IMO) 2025, prestiżową konkurencję dla młodych matematyków od 1959 r. IMO obejmuje matematykę przedniczniową matematyków. Medale są przyznawane pierwszej połowy zawodników, przy czym około 8% otrzymuje złoty medal.
Podczas zeszłego tygodnia IMO 2025 zaawansowany model głębokiego myślenia doskonale rozwiązał pięć z sześciu problemów, gromadząc 35 punktów. Ta wydajność jest uważana za poziom złota. Google udostępnił rozwiązania publicznie.
Aby to osiągnąć, zaawansowane Gemini zostało przeszkolone przy użyciu nowatorskich technik uczenia się wzmocnienia zaprojektowanych w celu zwiększenia możliwości rozumowania wieloetapowego, rozwiązywania problemów i aspektowania. Ponadto został wyposażony w wyselekcjonowany korpus wysokiej jakości rozwiązań problemów matematycznych i ogólnych wskazówek dotyczących zbliżania się do problemów IMO.
Osiągnięcie to stanowi znaczący postęp w porównaniu z wydajnością Google Deepmind w IMO 2024, gdzie alfageometria i alfaproof zabezpieczyły srebrny medal, rozwiązując cztery z sześciu problemów i zdobywając 28 punktów. Kluczową różnicą w tym roku jest to, że Gemini „obsługiwało kompleksowe w języku naturalnym, tworząc rygorystyczne dowody matematyczne bezpośrednio z oficjalnych opisów problemów-wszystko w czasie 4,5-godzinnego limitu konkurencji”. Natomiast modele 2024 wymagały przetłumaczenia problemów z języka naturalnego na języki specyficzne dla domeny.
Deep Think jest opisywany jako „ulepszony tryb rozumowania”, który obejmuje „najnowsze techniki badawcze”, takie jak myślenie równoległe. Umożliwia to modelu eksplorowanie i łączenie wielu potencjalnych rozwiązań jednocześnie, zamiast przestrzegać liniowego procesu myślowego.
Chociaż tryb GEMINI Deep Think został ogłoszony na I/O 2025, nie jest jeszcze szeroko dostępny. Google planuje, aby wersja tego głębokiego modelu jest dostępna dla wybranej grupy „zaufanych testerów”, w tym matematyków. Po tej fazie zostanie on zintegrowany z Google AI Ultra, choć konkretna data uruchomienia subskrybentów poziomu 250 USD miesięcznie pozostaje niepotwierdzona.
