Firma Google zaprezentowała swój najnowszy postęp w zakresie technologii mediów produktywnych. Firma podekscytowała społeczność twórczą, prezentując modele Veo i Imagen 3, które podnoszą poprzeczkę w zakresie tworzenia wideo i obrazów.
Firma udostępniła także nowe nagrania demo utworzone za pomocą Music AI Sandbox. Celem Google w przypadku tych innowacji jest wzmocnienie pozycji artystów i twórców poprzez zwiększenie roli sztucznej inteligencji w procesie twórczym.
Technologie sztucznej inteligencji zrewolucjonizowały w ostatnich latach sztukę i kreatywność. Chociaż nowe modele wzbogacają wizje artystów i twórców, nadal przesuwają granice świata technologii. W tym kontekście narzędzia do produkcji wideo i wizualnej wspierane przez sztuczną inteligencję otwierają nowe drzwi w dziedzinie muzyki i pozwalają tworzyć treści wysokiej jakości. Oto nowe modele!
Co oferuje Veo Google?
Google podnosi poprzeczkę w produkcji multimediów opartej na sztucznej inteligencji dzięki Veo, modelowi tworzenia wideo nowej generacji. Veo wyróżnia się możliwością tworzenia trwałych filmów w wysokiej rozdzielczości, które dokładnie odzwierciedlają twórcze wizje użytkowników. Jego umiejętność rozumienia terminów filmowych i tworzenia spójnego materiału filmowego sprawia, że Veo jest niezastąpione, szczególnie dla filmowców i producentów treści cyfrowych.
Veo wyróżnia się na tle konkurencji zwiększoną kontrolą i jakością produkcji wideo. Sora z OpenAI stała się silnym konkurentem w produkcji wideo. Jednak naprawdę trudno jest wybrać pomiędzy Veo i Sorą. Oba modele mogą tworzyć świetne filmy.
Z drugiej strony Veo rozumie terminy filmowe i najlepiej potrafi zinterpretować polecenia użytkownika. Na przykład szczegółowe polecenia, takie jak „timelapse” Lub “strzał z lotu ptaka” pozwalają modelowi tworzyć realistyczne filmy o wysokiej rozdzielczości.
Współpraca Google z filmowcem Donaldem Gloverem i jego studiem kreatywnym Gilga wyraźnie pokazuje przewagę Veo w procesie tworzenia filmów. Glover miał okazję poznać możliwości modelki wykorzystując Veo w swoim własnym projekcie filmowym. Ta współpraca stanowi część strategii Google mającej na celu rozwój technologii poprzez angażowanie w ten proces twórców. Dzięki wyjątkowej wiedzy filmowej Veo Glover był w stanie wyprodukować filmy, które najdokładniej odzwierciedlały jego twórczą wizję.
Google podkreśla, że model Veo sprawdził się w nauce rozumienia treści wideo, tworzeniu obrazów o wysokiej rozdzielczości i symulowaniu ruchów fizycznych w świecie rzeczywistym. Dlatego Veo jest silnym konkurentem Sory z OpenAI pod względem rozumienia terminów kinowych, tworzenia realistycznych obrazów i zapewniania kreatywnej kontroli.
Oto obraz 3
Obraz 3 to kolejny model sztucznej inteligencji, który maksymalizuje reprodukcję tekstu i obrazu. Model zapewnia fotorealistyczne obrazy z mniejszą liczbą błędów wizualnych niż poprzednie wersje. Może na przykład uzyskać szczegółowy portret wilka lub majestatyczne zdjęcie wejścia do biblioteki z pożądanymi szczegółami i odcieniami kolorów. Możliwości Image 3 można wykorzystać w różnych zastosowaniach, od reklamy po produkcję artystyczną.
Oto zachęta, której Google użył do wyświetlenia obrazu Wilka i wynik:
Podpowiedź: Zbliżenie eleganckiego wilka siedzącego po królewsku na szarym tle ze szczegółowymi drobnymi szczegółami, odizolowanego na płaskim zdjęciu stockowym z hiperrealistyczną gradacją kolorów na zdjęciu o wysokiej rozdzielczości.
Monit i wynik dla zdjęcia bibliotecznego:
Podpowiedź: Zdjęcie majestatycznego wejścia do biblioteki z wyrytym w kamieniu napisem „Biblioteka Centralna”.
AI w muzyce
W ramach współpracy ze społecznością muzyczną Google wprowadził Music AI Sandbox. Ten zestaw narzędzi pozwala użytkownikom tworzyć od podstaw nowe sekcje instrumentalne i przekształcać dźwięk na różne sposoby. Narzędzia te, które rozszerzyły rolę sztucznej inteligencji w produkcji muzycznej, zostały wykorzystane we współpracy z muzykiem, zdobywcą nagrody Grammy Wyclef Jeantekściarz Justin Tranteri muzyk elektroniczny Marka Rebilleta.
Wszyscy trzej artyści udostępnili na swoich kanałach YouTube nowe dema stworzone za pomocą Music AI Sandbox, prezentujące możliwości sztucznej inteligencji w procesie produkcji muzyki.
Z drugiej strony narzędzia cyfrowe, takie jak SynthID, są wykorzystywane w celu zapewnienia przestrzegania standardów bezpieczeństwa i etyki podczas opracowywania i wdrażania technologii. Oznacza to, że technologię tę można wykorzystać do przeprowadzania różnych testów bezpieczeństwa, stosowania filtrów czy dodawania cyfrowych znaków wodnych.
Sztuczna inteligencja w dalszym ciągu dostarcza przełomowe innowacje w produkcji wideo, wizualnej i muzycznej. Dzięki modelom takim jak Veo i Imagen 3 produkcja treści ewoluuje w niewyobrażalny wcześniej sposób. Narzędzia takie jak Music AI Sandbox pozwalają artystom wzbogacać ich pracę. Odpowiedzialny rozwój i wykorzystanie tych technologii maksymalizuje ich potencjał twórczy w społeczeństwie, przy jednoczesnym zachowaniu standardów etycznych. To duży krok naprzód w rozwoju zarówno technologii, jak i sztuki.
Autor wyróżnionego obrazu: Google
Source: Nowe generatywne modele mediów Google są niesamowite: Veo, Imagen 3 i inne