Model AI Gemini 2.5 Google osiągnął przełomową wydajność w finałach światowego Międzynarodowego Konkursu Programowania Collegiate (ICPC), rozwiązując 10 z 12 złożonych problemów algorytmicznych w celu zapewnienia złotego medalu. Według Google ten wyczyn, dokonany przez tę samą ogólną sztuczną inteligencję, stosowaną w codziennych aplikacjach, podkreśla znaczny postęp w generatywnej sztucznej inteligencji w kierunku sztucznej inteligencji ogólnej. ICPC, największa na świecie i najdłużej trwająca konkurencja programowa dla studentów, wyzwa uczestników z 12 misternymi łamigłówkami kodowania w ciągu pięciu godzin, testując umiejętności rozwiązywania problemów pod presją. W nowatorskiej integracji AI z konkurencją akademicką Google połączył swój wariant głębokiego myślenia Gemini 2.5 z zdalnym środowiskiem online zatwierdzonym przez ICPC. Ludzkie zespoły, liczące 139 z uniwersytetów na całym świecie, otrzymały 10-minutowy start, zanim AI zaczęła przetwarzać. W przeciwieństwie do wyspecjalizowanych modeli przeszkolonych na wydarzenia takie jak Międzynarodowa Olimpiada Matematyczna na początku tego roku, ta wersja Gemini nie została przekwalifikowana, ale ulepszona, aby utrzymać ciągłe „tokeny myślenia” przez cały pięciogodzinny czas trwania. Umożliwiło to model metodycznej analizy i generowania rozwiązań bez przerwy. Na zakończenie konkursu 10 poprawnych rozwiązań Gemini umieściło go na drugim miejscu wśród zespołów uniwersyteckich, przewyższając wszystkie oprócz czterech ludzi, które również osiągnęły złoty próg. System punktacji przyznaje wyłącznie za prawidłowe odpowiedzi, a szybsze zgłoszenia poprawiają rankingi. Co ciekawe, Gemini rozwiązał osiem problemów w ciągu pierwszych 45 minut, wykazując szybki początkowy postęp. Jego całkowita inwestycja czasu osiągnęła 677 minut w różnych wyzwaniach, odzwierciedlając wymaganą głębokość obliczeń. Dyrektor ICPC, Bill Poucher, chwalił kamień milowy, stwierdzając: „ICPC zawsze chodziło o ustanowienie najwyższych standardów w rozwiązywaniu problemów. Gemini z powodzeniem dołączają do tej areny i osiąganie wyników na poziomie złota, jest kluczowym momentem w definiowaniu narzędzi AI i standardów akademickich potrzebnych do następnej generacji”. Google udostępniło publicznie wszystkie rozwiązania Gemini na GitHub, zapraszając kontrolę od społeczności programistów. Wśród problemów Problem C wyróżniał się złożonością, zaskakując każdą ludzką drużynę. To wielowymiarowe zadanie optymalizacji obejmowało zarządzanie fikcyjnymi zbiornikami „flubbera” z możliwymi konfiguracją do przechowywania i szybkości drenażu. Gemini podszedł do niego innowacyjnie, przypisując wartości priorytetowe do każdego zbiornika, stosując dynamiczne programowanie w celu usprawnienia miejsca wyszukiwania. Po 30 minutach intensywnego przetwarzania AI zastosowała zagnieżdżone poszukiwania trójskładnikowe, aby zidentyfikować optymalną konfigurację, zapewniając precyzyjne rozwiązanie. Rozszerzając ocenę, Google przetestował Gemini 2.5 na wcześniejszych zestawach danych ICPC, ujawniając wydajność złotych medali zarówno dla zestawów pytań 2023, jak i 2024. Analiza wewnętrzna potwierdziła spójność modelu w rozwiązywaniu zaawansowanych wyzwań algorytmicznych. Sukces ten podkreśla potencjał Bliźniaczkach poza konkurencją, pozycjonując go jako cenne narzędzie w branżach o wysokiej stawce, takich jak inżynieria półprzewodnikowa i biotechnologia. Te pola często wymagają wieloetapowego logicznego uzasadnienia, aby optymalizować projekty lub symulować procesy biologiczne-targi, w których AI może przyspieszyć innowacje i rozwiązać długotrwałe problemy. Google podkreślił wspólną krawędź sztucznej inteligencji, zauważając, że połączenie możliwości Gemini z najlepszymi zespołami uniwersyteckami ludzkimi przyniosłoby idealne wyniki wszystkich 12 problemów. Taka synergia może wzmocnić ludzką wiedzę, wspierając przełom w złożonych domenach. Jednak wymagania obliczeniowe eksperymentu były znaczne. Podczas gdy Google nie ujawnił dokładnego zużycia energii ani kosztów, pięciogodzinny wniosek dotyczy modelu tej skali, oznacza znaczące wykorzystanie zasobów. Obecne zastosowania AI konsumenckie już odkształcają rentowność ze względu na wysokie potrzeby energetyczne, ale zwolennicy twierdzą, że odblokowanie rozwiązań wcześniej trudnych problemów – takich jak te w ICPC – może zrównoważyć wydatki poprzez transformacyjne zastosowania w badaniach i branży. Ten udział ICPC stanowi więcej niż wygrana reklamowa dla Google; Sygnalizuje dojrzewający krajobraz AI, w którym modele generatywne konkurują na równi z elitarnymi ludzkimi talentami. Ponieważ Big Tech kontynuuje ciężkie inwestycje w opracowywanie sztucznej inteligencji – narzędzia do podsumowania tekstu i narzędzia do przetwarzania sieci – takie zdania potwierdzają dążenie do „prawdziwej inteligencji”. W przypadku tysięcy studentów, którzy corocznie zajmują się wyczerpującymi łamigłówkami ICPC, wpis Gemini rodzi intrygujące pytania dotyczące przyszłości edukacji, konkurencji i rozwiązywania problemów. Dzięki rozwiązaniom otwartych do przeglądu, programiści na całym świecie mogą zbadać, w jaki sposób takie rozumowanie AI może ewoluować, aby rozwiązać zagadki kodowania w świecie rzeczywistym.

  Najlepsze gry mobilne 2020 roku (iPhone i Android)

Source: Google’s Gemini 2.5 wygrywa złoto ICPC z 10 rozwiązaniami