Google Gemini przygotowuje się do rywalizacji z GPT-4o

Wyścig o dominację w dziedzinie sztucznej inteligencji (AI) nabiera tempa pomiędzy Gemini i ChatGPT, a giganci technologiczni rywalizują o opracowanie najpotężniejszych i najbardziej wszechstronnych modeli sztucznej inteligencji.

Po imponującym ujawnieniu OpenAI GPT-4o, Google wkroczył do wyścigu AI, prezentując urzekającą demonstrację własnego prototypu niezwykle popularnego chatbota Gemini.

Film autorstwa Konto Google X zaprezentował telefon Pixel z systemem Gemini, analizując nagrania na żywo, prawdopodobnie nagrane podczas przygotowań do gali nadchodząca konferencja programistów Google I/O.

Demo ukazuje umiejętności konwersacyjne Gemini

W prezentowanym filmie użytkownik za pomocą komunikatów głosowych pyta sztuczną inteligencję o aktywność na ekranie. Odpowiedź Gemini, wypowiedziana naturalnie brzmiącym głosem, pokazuje zrozumienie kontekstu wizualnego. Prawidłowo identyfikuje budowę sceny jako przygotowanie do dużego wydarzenia. Po wyświetleniu monitu o pojawienie się napisu na ekranie Gemini rozpoznaje go jako oznakowanie Google I/O i podaje krótki opis zdarzenia.

Przedstawiono monitor AOC Agon AG493UCX: specyfikację, cenę i datę wydania

Podobnie jak niedawna demonstracja ChatGPT OpenAI, wideo Google Gemini jest godne uwagi ze względu na naturalny przebieg rozmowy. Interakcja użytkownika jest niemal ludzka, a reakcje Gemini odzwierciedlają rytm przyjaznego dialogu.

Jeszcze jeden dzień do #GoogleIO! Czujemy . Do zobaczenia jutro, aby uzyskać najnowsze wiadomości na temat sztucznej inteligencji, wyszukiwania i nie tylko. pic.twitter.com/QiS1G8GBf9
— Google (@Google) 13 maja 2024 r

To podejście konwersacyjne stanowi znaczące odejście od często sztywnych interakcji, których doświadczano w przypadku wcześniejszych modeli sztucznej inteligencji. Możliwość prowadzenia wzajemnej wymiany informacji, wyjaśniania informacji i dostosowywania odpowiedzi w oparciu o zapytania użytkowników toruje drogę do bardziej intuicyjnego i przyjaznego dla użytkownika doświadczenia związanego ze sztuczną inteligencją.

Wygląda na to, że po raz kolejny innowacja zrodzi się z konkurencji: Gemini vs ChatGPT.

Świadomość kontekstu jest tutaj kopalnią złota

Chociaż demonstracja skupiała się na beztroskim scenariuszu, potencjalne zastosowania Gemini wykraczają daleko poza cele rozrywkowe. Możliwość analizowania informacji wizualnych w czasie rzeczywistym może zmienić zasady gry w różnych dziedzinach.

Co to jest Finsta i jak założyć konto Finsta?

Wyobraź sobie lekarza korzystającego z Gemini podczas konsultacji z pacjentem, gdzie sztuczna inteligencja może natychmiast analizować obrazy medyczne i dostarczać spostrzeżeń lub potencjalnych diagnoz. W sferze edukacyjnej uczniowie mogą wykorzystywać Gemini do ulepszania swoich doświadczeń edukacyjnych, pozwalając sztucznej inteligencji analizować obiekty, eksperymenty lub artefakty historyczne w czasie rzeczywistym, co sprzyja głębszemu zrozumieniu przedmiotu.

Prototyp jest wciąż w budowie i jego pełne możliwości nie zostały jeszcze w pełni ujawnione. Demo zapewnia jednak obiecujący wgląd w przyszłość interakcji AI. Łącząc przetwarzanie języka naturalnego z analizą wideo w czasie rzeczywistym, Gemini może zmienić i ulepszyć sposób, w jaki wchodzimy w interakcję z informacjami i otaczającym nas światem, podobnie jak GPT-4o OpenAI.

Kiedy poznamy więcej szczegółów? Rozpocznie się wydarzenie Google I/O dziś wieczorem o 10:00 PT / 13:00 ET więc bądźcie na bieżąco i czytajcie nas, aby być świadkami przyszłości technologii.

Autor wyróżnionego obrazu: Solena Feyissy/Usuń rozpryski

Source: Google Gemini przygotowuje się do rywalizacji z GPT-4o

Ten monitor LG może się wygiąć, a gracze tracą zmysły