Google ogłoszony prywatny podgląd modelu generowania wideo Veo dla klientów Google Cloud korzystających z Vertex AI. Ogłoszenie umożliwia firmom takim jak Quora i Mondelez International wykorzystanie tej technologii sztucznej inteligencji do celów kreatywnych i marketingowych.
Zaprezentowany w kwietniu Veo może generować filmy w wysokiej rozdzielczości, w tym klipy 1080p o długości do sześciu sekund i różnej liczbie klatek na sekundę. Użytkownicy mogą tworzyć filmy, dostarczając obrazy wraz z podpowiedziami, co pozwala modelowi uchwycić różne style wizualne i kinowe. Warren Barkley, starszy dyrektor ds. zarządzania produktami w Google Cloud, podkreślił, że długie oczekiwanie na API wynikało z udoskonalenia modelu gotowości przedsiębiorstwa.
Model wyróżnia się generowaniem określonych efektów, takich jak eksplozje, i rozumie podstawowe pojęcia fizyczne. Może także wykonywać edycję maskowaną, umożliwiając użytkownikom modyfikowanie określonych regionów w filmie. Pomimo swoich możliwości Veo wykazuje niespójności typowe dla obecnej generatywnej sztucznej inteligencji, takie jak znikające obiekty i nierealistyczne zachowanie fizyki, co prowadzi do potencjalnych ograniczeń w jego użyciu.
Veo i Imagen 3: Co oferują
Google wprowadziło Veo wraz z Imagen 3, generatywnym modelem obrazu zaprojektowanym w celu tworzenia obrazów najwyższej jakości z podpowiedzi tekstowych. Obydwa modele będą dostępne dla klientów Vertex AI, a Imagen 3 stanie się powszechnie dostępny w przyszłym tygodniu. Do firm, które zaczęły korzystać z tych narzędzi, należą Oreo i Cadbury, kładąc nacisk na ich zastosowania komercyjne.
Podpowiedź z poniższego filmu: Samotny kowboj jedzie na koniu po otwartej równinie o pięknym zachodzie słońca, delikatnym świetle i ciepłych kolorach.
(Wideo: Google)
Podpowiedź z poniższego filmu: Zdjęcie lotnicze latarni morskiej stojącej wysoko na skalistym klifie, jej latarnia przecina wczesny świt, fale rozbijają się o skały poniżej
(Wideo: Google)
Barkley zauważył, że generatywna sztuczna inteligencja napędza transformację biznesową, a 86% przedsiębiorstw odnotowuje wzrost przychodów. Stwierdził, że Google angażuje się w rozwój technologii generatywnej sztucznej inteligencji, co widać w ich najnowszych ofertach z Veo i Imagen 3.
Aby zaradzić potencjalnemu nadużyciu, oba modele będą wyposażone w zabezpieczenia zapobiegające generowaniu szkodliwych treści. Dodatkowo wszystkie wyniki będą opatrzone cyfrowymi znakami wodnymi, w tym SynthID Google DeepMind, który zawiera niewidoczne znaczniki w celu zwalczania dezinformacji i błędnego przypisania. Google utrzymuje, że nie wykorzystuje danych klientów do uczenia swoich modeli, skupiając się zamiast tego na publicznie dostępnych zbiorach danych.
Zwiększanie funkcjonalności przedsiębiorstwa było priorytetem od chwili ogłoszenia Veo. Model został wyszkolony przy użyciu szerokiej gamy próbek wideo wysokiej jakości, chociaż szczegóły dotyczące konkretnych źródeł danych szkoleniowych pozostają nieujawnione. Barkley przyznał, że chociaż niektóre dane mogą obejmować treści YouTube, działają one na podstawie umów Google z twórcami treści.
Proaktywne podejście Google uwzględnia również ryzyko własności intelektualnej związane z generatywną sztuczną inteligencją. Veo ma oferować filtry natychmiastowe blokujące treści zawierające przemoc i wulgarne, a Barkley wskazał, że produkty Veo będą objęte polityką odszkodowawczą chroniącą użytkowników przed roszczeniami o naruszenie praw autorskich.
W miarę stopniowej integracji Veo z większą liczbą produktów Google model został wprowadzony do testów w maju w Laboratorium Google, a we wrześniu ogłoszony w ramach YouTube Shorts. Jednak Google musiał stawić czoła konkurencji w obszarze generatywnej sztucznej inteligencji ze strony firm takich jak OpenAI i Adobe, które szybko nawiązały współpracę z różnymi studiami i agencjami kreatywnymi.
Autor wyróżnionego obrazu: Google DeepMind
Post Nowe narzędzia AI Google na zawsze zmieniają tworzenie wideo i obrazów pojawił się jako pierwszy w TechBriefly.








