Wyścig o dominację w dziedzinie sztucznej inteligencji (AI) nabiera tempa pomiędzy Gemini i ChatGPT, a giganci technologiczni rywalizują o opracowanie najpotężniejszych i najbardziej wszechstronnych modeli sztucznej inteligencji.
Po imponującym ujawnieniu OpenAI GPT-4o, Google wkroczył do wyścigu AI, prezentując urzekającą demonstrację własnego prototypu niezwykle popularnego chatbota Gemini.
Film autorstwa Konto Google X zaprezentował telefon Pixel z systemem Gemini, analizując nagrania na żywo, prawdopodobnie nagrane podczas przygotowań do gali nadchodząca konferencja programistów Google I/O.
Demo ukazuje umiejętności konwersacyjne Gemini
W prezentowanym filmie użytkownik za pomocą komunikatów głosowych pyta sztuczną inteligencję o aktywność na ekranie. Odpowiedź Gemini, wypowiedziana naturalnie brzmiącym głosem, pokazuje zrozumienie kontekstu wizualnego. Prawidłowo identyfikuje budowę sceny jako przygotowanie do dużego wydarzenia. Po wyświetleniu monitu o pojawienie się napisu na ekranie Gemini rozpoznaje go jako oznakowanie Google I/O i podaje krótki opis zdarzenia.
Podobnie jak niedawna demonstracja ChatGPT OpenAI, wideo Google Gemini jest godne uwagi ze względu na naturalny przebieg rozmowy. Interakcja użytkownika jest niemal ludzka, a reakcje Gemini odzwierciedlają rytm przyjaznego dialogu.
Jeszcze jeden dzień do #GoogleIO! Czujemy . Do zobaczenia jutro, aby uzyskać najnowsze wiadomości na temat sztucznej inteligencji, wyszukiwania i nie tylko. pic.twitter.com/QiS1G8GBf9
— Google (@Google) 13 maja 2024 r
To podejście konwersacyjne stanowi znaczące odejście od często sztywnych interakcji, których doświadczano w przypadku wcześniejszych modeli sztucznej inteligencji. Możliwość prowadzenia wzajemnej wymiany informacji, wyjaśniania informacji i dostosowywania odpowiedzi w oparciu o zapytania użytkowników toruje drogę do bardziej intuicyjnego i przyjaznego dla użytkownika doświadczenia związanego ze sztuczną inteligencją.
Wygląda na to, że po raz kolejny innowacja zrodzi się z konkurencji: Gemini vs ChatGPT.
Świadomość kontekstu jest tutaj kopalnią złota
Chociaż demonstracja skupiała się na beztroskim scenariuszu, potencjalne zastosowania Gemini wykraczają daleko poza cele rozrywkowe. Możliwość analizowania informacji wizualnych w czasie rzeczywistym może zmienić zasady gry w różnych dziedzinach.
Wyobraź sobie lekarza korzystającego z Gemini podczas konsultacji z pacjentem, gdzie sztuczna inteligencja może natychmiast analizować obrazy medyczne i dostarczać spostrzeżeń lub potencjalnych diagnoz. W sferze edukacyjnej uczniowie mogą wykorzystywać Gemini do ulepszania swoich doświadczeń edukacyjnych, pozwalając sztucznej inteligencji analizować obiekty, eksperymenty lub artefakty historyczne w czasie rzeczywistym, co sprzyja głębszemu zrozumieniu przedmiotu.
Prototyp jest wciąż w budowie i jego pełne możliwości nie zostały jeszcze w pełni ujawnione. Demo zapewnia jednak obiecujący wgląd w przyszłość interakcji AI. Łącząc przetwarzanie języka naturalnego z analizą wideo w czasie rzeczywistym, Gemini może zmienić i ulepszyć sposób, w jaki wchodzimy w interakcję z informacjami i otaczającym nas światem, podobnie jak GPT-4o OpenAI.
Kiedy poznamy więcej szczegółów? Rozpocznie się wydarzenie Google I/O dziś wieczorem o 10:00 PT / 13:00 ET więc bądźcie na bieżąco i czytajcie nas, aby być świadkami przyszłości technologii.
Autor wyróżnionego obrazu: Solena Feyissy/Usuń rozpryski
Source: Google Gemini przygotowuje się do rywalizacji z GPT-4o