Pas startowy ma niedawno odsłonięty swoje najnowsze oprogramowanie sztucznej inteligencji, zwane Gen-2 Runway AI, które stanowi znaczący skok technologiczny w stosunku do swojego poprzednika, Gen-1. Podczas gdy poprzednia wersja była w stanie generować nowe filmy przy użyciu danych z istniejących, sztuczna inteligencja pasa startowego Gen-2 może tworzyć kompletne filmy wyłącznie na podstawie opisów tekstowych.
Firma pracuje nad tym najnowocześniejszym modelem od września ubiegłego roku iz dumą ogłasza, że jest to pierwszy na rynku publicznie dostępny model zamiany tekstu na wideo, który jest w stanie realistycznie i konsekwentnie syntezować nowe filmy.
Twórz filmy za pomocą samych słów. Jeśli możesz to powiedzieć, teraz możesz to zobaczyć.
Przedstawiamy tekst do wideo. Z Gen-2.
Dowiedz się więcej na https://t.co/PsJh664G0Q pic.twitter.com/6qEgcZ9QV4
— Pas startowy (@runwayml) 20 marca 2023 r
Gen-2 Runway AI może tworzyć filmy za pomocą monitów tekstowych
Dzięki połączeniu imponujących funkcji Gen-1, które pozwoliły zastosować kompozycję i styl obrazu lub zachęty tekstowej do struktury źródłowego wideo w celu stworzenia nowego, sztuczna inteligencja Gen-2 Runway jest znaczącym krokiem naprzód. Może teraz tworzyć całkowicie nowe treści wideo na podstawie samych opisów tekstowych, co jest niezwykłym osiągnięciem. Platforma internetowa jest w stanie generować filmy o stosunkowo wysokiej rozdzielczości, które, choć nie są fotorealistyczne, wyraźnie demonstrują moc tej technologii. W porównaniu z tym, co jest obecnie dostępne na rynku, filmy wyprodukowane przez sztuczną inteligencję Gen-2 Runway są dość imponujące.
„Głębokie sieci neuronowe do syntezy obrazu i wideo stają się coraz bardziej precyzyjne, realistyczne i sterowalne. W ciągu kilku lat przeszliśmy od rozmytych obrazów o niskiej rozdzielczości do wysoce realistycznych i estetycznych obrazów, co umożliwiło rozwój mediów syntetycznych” — stwierdza firma.
„Runway Research stoi na czele tych zmian i zapewniamy, że przyszłość tworzenia treści jest zarówno dostępna, kontrolowalna, jak i wzmacniająca dla użytkowników. Wierzymy, że techniki głębokiego uczenia się zastosowane do treści audiowizualnych na zawsze zmienią sztukę, kreatywność i narzędzia projektowe”.
Chociaż filmy generowane przez sztuczną inteligencję Gen-2 Runway nie są jeszcze w stanie bezproblemowo zastąpić rzeczywistych filmów, technologia ta przeszła długą drogę od swoich początków. Przy dalszym postępie jest prawdopodobne, że stanie się to możliwe w niedalekiej przyszłości, zwłaszcza jeśli technologia podąża podobną trajektorią do generatorów tekstu na obraz, takich jak Midjourney.

Na przykład w zeszłym roku Midjourney nie był w stanie stworzyć obrazów, które mogłyby niezawodnie uchodzić za rzeczywiste zdjęcia. Jednak wraz z premierą wersji 5 w zeszłym tygodniu to się zmieniło, pokazując szybki postęp w dziedzinie wizualizacji generowanych przez sztuczną inteligencję. Jeśli sztuczna inteligencja pasa startowego Gen-2 będzie się rozwijać w podobnym tempie, możliwe, że wkrótce będzie w stanie produkować filmy, które są praktycznie nie do odróżnienia od prawdziwego materiału filmowego.
Należy zauważyć, że chociaż Runway jest pierwszą firmą, która udostępniła tę technologię publicznie, nie jest jedyną, która pracuje nad generowaniem tekstu na wideo. Na przykład Google od jakiegoś czasu eksperymentuje z tą technologią. Podobnie, podobnie jak w sektorze przetwarzania tekstu na obraz jest wielu graczy, prawdopodobne jest, że w obszarze przetwarzania tekstu na wideo szybko pojawi się wielu konkurentów w miarę postępu technologii. W rezultacie możemy spodziewać się lawiny nowych rozwiązań w tej dziedzinie w nadchodzących miesiącach i latach.

Najnowszy przełom w Runway Gen-2 Runway AI to znaczący krok naprzód w technologii text-to-video. Chociaż filmy generowane przez sztuczną inteligencję nie są jeszcze fotorealistyczne, pokazują potencjał tej przełomowej technologii.
Co więcej, fakt, że Runway udostępnił tę technologię publicznie, podkreśla znaczenie demokratyzacji sztucznej inteligencji i udostępnienia jej szerszemu gronu ludzi. Warto zauważyć, że Runway nie jest sam w tej dziedzinie, a inne firmy, takie jak Google, również eksperymentują z generowaniem tekstu na wideo. Wraz z rozwojem technologii możemy spodziewać się wejścia na rynek większej liczby graczy i dalszego rozwoju w tej dziedzinie.
Source: Gen-2 Runway AI: duży krok naprzód w przetwarzaniu tekstu na wideo