Demis Hassabis, dyrektor generalny Google DeepMind, ujawnił plany zintegrowania modeli AI Gemini z generującymi Veo wideo modeli AI w celu zwiększenia zrozumienia świata fizycznego przez Gemini, jak ujawniono w ostatnim wywiadzie podcastu.

Według Hassabis Gemini został od samego początku zaprojektowany tak, aby był multimodalny, w celu stworzenia „uniwersalnego asystenta cyfrowego”, który może pomóc użytkownikom w scenariuszach w świecie rzeczywistym. „Zawsze budowaliśmy Gemini, nasz model fundamentu, aby być multimodalnym od samego początku”, wyjaśnił Hassabis, „i powód, dla którego to zrobiliśmy [is because] Mamy wizję tego pomysłu uniwersalnego asystenta cyfrowego, asystenta […] Właściwie pomaga ci w prawdziwym świecie ”.

Branża AI jest świadkiem zmiany w kierunku modeli „omni”, które mogą przetwarzać i generować wiele form mediów, takich jak dźwięk, obrazy i tekst. Najnowsze modele Google Gemini mogą wytwarzać dźwięk, obrazy i tekst, podczas gdy Chatgpt Openai może tworzyć obrazy, w tym sztukę w stylu studio Ghibli. Amazon ogłosił także plany uruchomienia modelu „dowolnego” jeszcze w tym roku, co dodatkowo ilustruje ten trend.

Te modele OMNI wymagają ogromnych ilości danych szkoleniowych, w tym obrazów, filmów, audio i tekstu. Hassabis wskazał, że dane wideo Veo pochodzą przede wszystkim z YouTube, platformy należącej do Google. „Zasadniczo oglądając filmy z YouTube – dużo filmów z YouTube – [Veo 2] Można dowiedzieć się, jak fizyka świata ” – stwierdził Hassabis. Google wcześniej poinformował TechCrunch, że jego modele„ mogą być przeszkoleni w zakresie „niektórych” treści YouTube zgodnie z umową z twórcami YouTube.

  Jak kontrolować Alt Delete na komputerze Mac?

Warto zauważyć, że Google poszerzył warunki usług w zeszłym roku, częściowo w celu uzyskania dostępu do większej liczby danych, w tym treści YouTube, do szkolenia jego modeli AI. Ten ruch jest postrzegany jako strategiczny wysiłek wzmocnienia swoich możliwości AI poprzez wykorzystanie ogromnego repozytorium danych online.

Post Google, aby połączyć modele Bliźnięta i Veo AI, pojawił się pierwszy w Techbriefly.

Source: Google, aby połączyć modele Gemini i Veo AI