Google ma wystrzelony Gemini 2, wyrafinowany model sztucznej inteligencji, który zwiększa zdolność użytkowników do interakcji z technologią. To ogłoszenie, ogłoszone podczas wydarzenia prasowego, podkreśla możliwości Gemini 2 w zakresie wykonywania zadań, zdolności konwersacyjnych i rozumienia multimodalnego, co stanowi znaczący postęp w technologii sztucznej inteligencji.
Google wprowadza Gemini 2: nową erę dla asystentów AI
Demis Hassabis, dyrektor generalny Google DeepMind, zauważył, że Gemini 2 działa jako wirtualny asystent, który może „planować i wykonywać zadania na komputerach użytkowników i w Internecie”. Model ma pomóc użytkownikom w płynnym zarządzaniu różnymi działaniami, potencjalnie torując drogę do sztucznej inteligencji ogólnej (AGI) poprzez naśladowanie funkcji poznawczych podobnych do ludzkich. Dyrektor generalny Google, Sundar Pichai, podkreślił zaangażowanie firmy w rozwój „modeli agentowych”, które mogą skuteczniej rozumieć świat i działać w nim efektywniej, wskazując na znaczące inwestycje poczynione w ciągu ostatniego roku.
Gemini 2 zawiera ulepszone funkcje „multimodalne”, które pozwalają sztucznej inteligencji skuteczniej analizować dźwięk i obraz podczas prowadzenia zaawansowanych rozmów. Demonstrując te możliwości, Gemini 2 może na nowo zdefiniować sposób działania komputerów osobistych, potencjalnie oszczędzając czas dzięki zautomatyzowanym zadaniom, takim jak rezerwacja lotów i zarządzanie dokumentami. Jednakże nadal istnieją wyzwania dotyczące zdolności tej technologii do przetwarzania poleceń otwartych bez błędów, co może prowadzić do kosztownych błędów.
Wyspecjalizowani agenci sztucznej inteligencji do kodowania i analizy danych również stanowią część zestawu narzędzi Gemini 2, umożliwiając użytkownikom radzenie sobie ze złożonymi zadaniami programistycznymi, które wykraczają poza możliwości wcześniejszych modeli. W przeciwieństwie do dominujących narzędzi AI, które koncentrują się na podstawowym uzupełnianiu kodu, agenci ci mogą wykonywać kompleksowe zadania, takie jak sprawdzanie kodu w repozytoriach i ułatwianie analizy danych.

Project Mariner: Nowe podejście do nawigacji internetowej
Aby zaprezentować możliwości Gemini 2, Google wprowadziło Project Mariner, eksperymentalne rozszerzenie do przeglądarki Chrome, które pomaga użytkownikom poruszać się po Internecie. W niedawnej demonstracji agent sztucznej inteligencji miał za zadanie zaplanować posiłek, samodzielnie przechodząc na stronę supermarketu, logując się i dodając produkty do koszyka, a nawet sugerując wymianę, gdy określone produkty były niedostępne. Hassabis opisał Marinera jako prototyp badawczy, który na nowo wyobraża interakcje użytkownika z sztuczną inteligencją, ukierunkowując się na codzienne zadania.
Gemini został pierwotnie uruchomiony w grudniu 2023 r. w ramach strategii Google mającej na celu konkurowanie z usługą ChatGPT firmy OpenAI, która zyskała uznanie dzięki swojej użyteczności w doświadczeniach wspomaganych sztuczną inteligencją. Wraz z wprowadzeniem Gemini 2, Google pozycjonuje swój model na równi z ofertą OpenAI, mając na celu poprawę komfortu wyszukiwania dzięki funkcjom opartym na sztucznej inteligencji.
Google ujawniło także najnowszą wersję Project Astra, eksperymentalnej inicjatywy, która pozwala Gemini 2 interpretować otoczenie użytkownika za pomocą aparatu w smartfonie. Podczas testów Gemini 2 wykazał się umiejętnością rozpoznawania butelek wina, dostarczania informacji geograficznych, cen i cech smakowych pochodzących z Internetu. Hassabis wyraził pragnienie, aby Astra przekształciła się w ostateczny system rekomendacji, zdolny do łączenia zainteresowań w różnych domenach w celu poprawy doświadczeń użytkowników.
Skoncentrowanie się na pamięci w Gemini 2 pozwala sztucznej inteligencji zachować wgląd w preferencje użytkownika, a Google zapewnia użytkownikom możliwość zarządzania swoimi danymi, w tym możliwością usuwania. Podczas testów z Astrą sztuczna inteligencja wykazała imponującą zdolność adaptacji, utrzymując kontekst konwersacyjny i reagując na zakłócenia.
Bezpieczeństwo i niezawodność agentów AI
W miarę rozszerzania się funkcjonalności Gemini 2 Google podkreśla znaczenie zapewnienia bezpieczeństwa i niezawodności. Chociaż agenci są obiecujący, potencjalne ryzyko wynika ze sposobu, w jaki użytkownicy mogą wchodzić w interakcje z systemami i dostarczanymi przez nie danymi. Project Mariner zawiera monity wymagające potwierdzenia przez użytkownika przed wykonaniem wrażliwych działań, chroniąc w ten sposób przed nieautoryzowanymi transakcjami.
Google aktywnie rozwiązuje problemy związane z bezpieczeństwem, współpracując z wewnętrznymi i zewnętrznymi ekspertami w celu oceny ryzyka związanego z wykorzystaniem sztucznej inteligencji. Obejmuje to badanie środków zapobiegających niewłaściwemu korzystaniu z platformy poprzez złośliwe monity lub instrukcje, chroniąc w ten sposób użytkowników przed potencjalnymi zagrożeniami, takimi jak oszustwa lub ataki typu phishing.
Wydanie przez Google Gemini 2 to kluczowy moment w rozwoju sztucznej inteligencji, ponieważ firma w dalszym ciągu śledzi doświadczenia i opinie użytkowników. Podróż w kierunku AGI stopniowo rozwija się z każdą fazą rozwoju, podkreślając trwające badania, które mogą mieć wpływ na przyszłe iteracje technologii. W miarę kontynuacji dochodzeń w sprawie interakcji i reakcji użytkowników wydaje się, że kolejne kroki w przypadku Gemini 2 i powiązanych z nim projektów są ściśle monitorowane.
Kredyty obrazkowe: Google
Post Google Gemini 2.0 jest tutaj: Multimodalny i potężny pojawił się jako pierwszy w TechBriefly.





