Już jest Google Gemini 2.0: multimodalny i potężny

Google ma wystrzelony Gemini 2, wyrafinowany model sztucznej inteligencji, który zwiększa zdolność użytkowników do interakcji z technologią. To ogłoszenie, ogłoszone podczas wydarzenia prasowego, podkreśla możliwości Gemini 2 w zakresie wykonywania zadań, zdolności konwersacyjnych i rozumienia multimodalnego, co stanowi znaczący postęp w technologii sztucznej inteligencji.

Google wprowadza Gemini 2: nową erę dla asystentów AI

Demis Hassabis, dyrektor generalny Google DeepMind, zauważył, że Gemini 2 działa jako wirtualny asystent, który może „planować i wykonywać zadania na komputerach użytkowników i w Internecie”. Model ma pomóc użytkownikom w płynnym zarządzaniu różnymi działaniami, potencjalnie torując drogę do sztucznej inteligencji ogólnej (AGI) poprzez naśladowanie funkcji poznawczych podobnych do ludzkich. Dyrektor generalny Google, Sundar Pichai, podkreślił zaangażowanie firmy w rozwój „modeli agentowych”, które mogą skuteczniej rozumieć świat i działać w nim efektywniej, wskazując na znaczące inwestycje poczynione w ciągu ostatniego roku.

Gemini 2 zawiera ulepszone funkcje „multimodalne”, które pozwalają sztucznej inteligencji skuteczniej analizować dźwięk i obraz podczas prowadzenia zaawansowanych rozmów. Demonstrując te możliwości, Gemini 2 może na nowo zdefiniować sposób działania komputerów osobistych, potencjalnie oszczędzając czas dzięki zautomatyzowanym zadaniom, takim jak rezerwacja lotów i zarządzanie dokumentami. Jednakże nadal istnieją wyzwania dotyczące zdolności tej technologii do przetwarzania poleceń otwartych bez błędów, co może prowadzić do kosztownych błędów.

Możesz zostać narażony na naruszenie bezpieczeństwa danych Duolingo

Wyspecjalizowani agenci sztucznej inteligencji do kodowania i analizy danych również stanowią część zestawu narzędzi Gemini 2, umożliwiając użytkownikom radzenie sobie ze złożonymi zadaniami programistycznymi, które wykraczają poza możliwości wcześniejszych modeli. W przeciwieństwie do dominujących narzędzi AI, które koncentrują się na podstawowym uzupełnianiu kodu, agenci ci mogą wykonywać kompleksowe zadania, takie jak sprawdzanie kodu w repozytoriach i ułatwianie analizy danych.

Google Gemini 2.0 już tu jest: multimodalny i potężny — Już jest Google Gemini 2.0: multimodalny i potężny

Project Mariner: Nowe podejście do nawigacji internetowej

Aby zaprezentować możliwości Gemini 2, Google wprowadziło Project Mariner, eksperymentalne rozszerzenie do przeglądarki Chrome, które pomaga użytkownikom poruszać się po Internecie. W niedawnej demonstracji agent sztucznej inteligencji miał za zadanie zaplanować posiłek, samodzielnie przechodząc na stronę supermarketu, logując się i dodając produkty do koszyka, a nawet sugerując wymianę, gdy określone produkty były niedostępne. Hassabis opisał Marinera jako prototyp badawczy, który na nowo wyobraża interakcje użytkownika z sztuczną inteligencją, ukierunkowując się na codzienne zadania.

Gemini został pierwotnie uruchomiony w grudniu 2023 r. w ramach strategii Google mającej na celu konkurowanie z usługą ChatGPT firmy OpenAI, która zyskała uznanie dzięki swojej użyteczności w doświadczeniach wspomaganych sztuczną inteligencją. Wraz z wprowadzeniem Gemini 2, Google pozycjonuje swój model na równi z ofertą OpenAI, mając na celu poprawę komfortu wyszukiwania dzięki funkcjom opartym na sztucznej inteligencji.

KuCoin wprowadza KuCoin IGO, aby udostępnić NFT w grze milionom użytkowników

Google ujawniło także najnowszą wersję Project Astra, eksperymentalnej inicjatywy, która pozwala Gemini 2 interpretować otoczenie użytkownika za pomocą aparatu w smartfonie. Podczas testów Gemini 2 wykazał się umiejętnością rozpoznawania butelek wina, dostarczania informacji geograficznych, cen i cech smakowych pochodzących z Internetu. Hassabis wyraził pragnienie, aby Astra przekształciła się w ostateczny system rekomendacji, zdolny do łączenia zainteresowań w różnych domenach w celu poprawy doświadczeń użytkowników.

Skoncentrowanie się na pamięci w Gemini 2 pozwala sztucznej inteligencji zachować wgląd w preferencje użytkownika, a Google zapewnia użytkownikom możliwość zarządzania swoimi danymi, w tym możliwością usuwania. Podczas testów z Astrą sztuczna inteligencja wykazała imponującą zdolność adaptacji, utrzymując kontekst konwersacyjny i reagując na zakłócenia.

Bezpieczeństwo i niezawodność agentów AI

W miarę rozszerzania się funkcjonalności Gemini 2 Google podkreśla znaczenie zapewnienia bezpieczeństwa i niezawodności. Chociaż agenci są obiecujący, potencjalne ryzyko wynika ze sposobu, w jaki użytkownicy mogą wchodzić w interakcje z systemami i dostarczanymi przez nie danymi. Project Mariner zawiera monity wymagające potwierdzenia przez użytkownika przed wykonaniem wrażliwych działań, chroniąc w ten sposób przed nieautoryzowanymi transakcjami.

Google aktywnie rozwiązuje problemy związane z bezpieczeństwem, współpracując z wewnętrznymi i zewnętrznymi ekspertami w celu oceny ryzyka związanego z wykorzystaniem sztucznej inteligencji. Obejmuje to badanie środków zapobiegających niewłaściwemu korzystaniu z platformy poprzez złośliwe monity lub instrukcje, chroniąc w ten sposób użytkowników przed potencjalnymi zagrożeniami, takimi jak oszustwa lub ataki typu phishing.

PlayStation 6 pojawi się w 2027 r. Według wycieku

Wydanie przez Google Gemini 2 to kluczowy moment w rozwoju sztucznej inteligencji, ponieważ firma w dalszym ciągu śledzi doświadczenia i opinie użytkowników. Podróż w kierunku AGI stopniowo rozwija się z każdą fazą rozwoju, podkreślając trwające badania, które mogą mieć wpływ na przyszłe iteracje technologii. W miarę kontynuacji dochodzeń w sprawie interakcji i reakcji użytkowników wydaje się, że kolejne kroki w przypadku Gemini 2 i powiązanych z nim projektów są ściśle monitorowane.

Kredyty obrazkowe: Google

Post Google Gemini 2.0 jest tutaj: Multimodalny i potężny pojawił się jako pierwszy w TechBriefly.

Source: Już jest Google Gemini 2.0: multimodalny i potężny