Wyścig o dominację w dziedzinie sztucznej inteligencji (AI) nabiera tempa pomiędzy Gemini i ChatGPT, a giganci technologiczni rywalizują o opracowanie najpotężniejszych i najbardziej wszechstronnych modeli sztucznej inteligencji.

Po imponującym ujawnieniu OpenAI GPT-4o, Google wkroczył do wyścigu AI, prezentując urzekającą demonstrację własnego prototypu niezwykle popularnego chatbota Gemini.

Film autorstwa Konto Google X zaprezentował telefon Pixel z systemem Gemini, analizując nagrania na żywo, prawdopodobnie nagrane podczas przygotowań do gali nadchodząca konferencja programistów Google I/O.

Demo ukazuje umiejętności konwersacyjne Gemini

W prezentowanym filmie użytkownik za pomocą komunikatów głosowych pyta sztuczną inteligencję o aktywność na ekranie. Odpowiedź Gemini, wypowiedziana naturalnie brzmiącym głosem, pokazuje zrozumienie kontekstu wizualnego. Prawidłowo identyfikuje budowę sceny jako przygotowanie do dużego wydarzenia. Po wyświetleniu monitu o pojawienie się napisu na ekranie Gemini rozpoznaje go jako oznakowanie Google I/O i podaje krótki opis zdarzenia.

  Jak odrzucić towarzysza Bannerlorda?

Podobnie jak niedawna demonstracja ChatGPT OpenAI, wideo Google Gemini jest godne uwagi ze względu na naturalny przebieg rozmowy. Interakcja użytkownika jest niemal ludzka, a reakcje Gemini odzwierciedlają rytm przyjaznego dialogu.

To podejście konwersacyjne stanowi znaczące odejście od często sztywnych interakcji, których doświadczano w przypadku wcześniejszych modeli sztucznej inteligencji. Możliwość prowadzenia wzajemnej wymiany informacji, wyjaśniania informacji i dostosowywania odpowiedzi w oparciu o zapytania użytkowników toruje drogę do bardziej intuicyjnego i przyjaznego dla użytkownika doświadczenia związanego ze sztuczną inteligencją.

Wygląda na to, że po raz kolejny innowacja zrodzi się z konkurencji: Gemini vs ChatGPT.

Świadomość kontekstu jest tutaj kopalnią złota

Chociaż demonstracja skupiała się na beztroskim scenariuszu, potencjalne zastosowania Gemini wykraczają daleko poza cele rozrywkowe. Możliwość analizowania informacji wizualnych w czasie rzeczywistym może zmienić zasady gry w różnych dziedzinach.

  WhatsApp udostępni nową funkcję „wyświetl raz” dla zdjęć i filmów

Wyobraź sobie lekarza korzystającego z Gemini podczas konsultacji z pacjentem, gdzie sztuczna inteligencja może natychmiast analizować obrazy medyczne i dostarczać spostrzeżeń lub potencjalnych diagnoz. W sferze edukacyjnej uczniowie mogą wykorzystywać Gemini do ulepszania swoich doświadczeń edukacyjnych, pozwalając sztucznej inteligencji analizować obiekty, eksperymenty lub artefakty historyczne w czasie rzeczywistym, co sprzyja głębszemu zrozumieniu przedmiotu.

Prototyp jest wciąż w budowie i jego pełne możliwości nie zostały jeszcze w pełni ujawnione. Demo zapewnia jednak obiecujący wgląd w przyszłość interakcji AI. Łącząc przetwarzanie języka naturalnego z analizą wideo w czasie rzeczywistym, Gemini może zmienić i ulepszyć sposób, w jaki wchodzimy w interakcję z informacjami i otaczającym nas światem, podobnie jak GPT-4o OpenAI.

Kiedy poznamy więcej szczegółów? Rozpocznie się wydarzenie Google I/O dziś wieczorem o 10:00 PT / 13:00 ET więc bądźcie na bieżąco i czytajcie nas, aby być świadkami przyszłości technologii.


Autor wyróżnionego obrazu: Solena Feyissy/Usuń rozpryski

Source: Google Gemini przygotowuje się do rywalizacji z GPT-4o

  Darmowe gry do grania w lutym 2022: PC, PlayStation, Xbox