Luma AI, wybitny gracz w generacji obrazu i wideo opartych na AI, zaprezentował Ray3, inauguracyjny model wideo rozumowania zaprojektowanego do złożonych sekwencji akcji z ulepszoną precyzją. Wydany i dostępny natychmiast, Ray3 stanowi znaczący postęp w generatywnej technologii wideo AI, umożliwiając twórcom tworzenie bardziej wyrafinowanych klipów, które utrzymują spójność z czasem. U podstaw innowacji Ray3 leży jego rozumowanie, które odróżnia ją od tradycyjnych modeli. W przeciwieństwie do standardowych systemów AI, które bezpośrednio tłumaczą podpowiedź tekstowe na wizualizacje, modele rozumujące takie jak Ray3 przydzielają dodatkowe zasoby obliczeniowe do dokładnego przetwarzania żądań. Obejmuje to mechanizmy samooceny, które udoskonalają wyniki, zmniejszając błędy i dodanie szczegółów. W przypadku generowania wideo oznacza to obsługę skomplikowanych podpowiedzi bez typowej degradacji obserwowanej w dłuższych sekwencjach. Benchmarki branżowe wskazują, że większość filmów generowanych przez AI rozwija się w przedziale 5 do 10 sekund, przy czym dłuższe czasy często powodują niespójności lub „chwiejne” wyniki. Ray3 łagodzi te problemy poprzez metodyczną ocenę i iterowanie swoich dzieł, umożliwiając bardziej zaawansowane sceny, które były wcześniej trudne. Dyrektor generalny Luma AI, Amit Jain, podkreślił sprawność oceny modelu podczas wywiadu z CNET. „Jest w stanie ocenić i powiedzieć:„ Och, to nie jest dobre, lub potrzebuję tego, aby być lepszym w ten sposób ”-wyjaśnił Jain, podkreślając, w jaki sposób Ray3 wykracza poza prostą konwersję tekstu na piksel, aby aktywnie poprawić jakość treści. Uzupełniając silnik rozumowania, Ray3 wprowadza praktyczne narzędzia dla użytkowników. Nowatorska funkcja adnotacji wizualnej zapewnia przejrzystość procesu decyzyjnego modelu, wyświetlając adnotacje, takie jak markery znaków w zakresie korekt lub regionów w celu zachowania niezmienionych. Umożliwia to użytkownikom ramki i określenie modyfikacji dla kolejnych podpowiedzi, wspierając iteracyjną kreatywność. Ponadto RAY3 obsługuje generowanie w 16-bitowym formacie HDR, zapewniając doskonałą rozdzielczość, drobniejsze szczegóły i zwiększoną przejrzystość w porównaniu do standardowych wyników. Aby usprawnić przepływy pracy, Luma AI wdrożyła tryb roboczy, który przyspiesza prototypowanie. W tym trybie użytkownicy mogą generować klipy o niskiej rozdzielczości w ciągu około 20 sekund, idealne do testowania koncepcji. Po zadowoleniu te projekty mogą być podwyższone do wersji o wysokiej wierności, według Jaina, proces, który trwa od 2 do 5 minut. Te funkcje stanowią Ray3 jako wszechstronne narzędzie zarówno dla profesjonalnych twórców, jak i entuzjastów AI poszukujących wydajnej, wysokiej jakości produkcji wideo. Uruchomienie Ray3 pojawia się wśród wzrostu modeli wideo AI od gigantów branżowych. Konkurenci, tacy jak Midjourney i Google Veo 3, podobnie rozwinęli swoją ofertę, koncentrując się na podwyższonej jakości, integracji audio (jak w VEO 3) i szerszej dostępności przyciągania profesjonalnych użytkowników. Jednak szybkie rozprzestrzenianie się takich technologii wywołało obawy w społeczności kreatywnych. Specjaliści podnieśli alarmy dotyczące etycznych konsekwencji mediów generowanych przez AI, w tym praktyk szkolenia danych i ryzyka wdrażania. Doprowadziło to do kilku procesów zbiorowych złożonych przez artystów przeciwko firmom AI, zarzucając niewłaściwe wykorzystanie dzieł chronionych prawem autorskim. LUMA AI zajmuje się obsługą danych użytkowników w swojej polityce prywatności, stwierdzając, że dostarczane informacje mogą być wykorzystywane do udoskonalenia i ulepszania jego usług. W miarę ewolucji krajobrazu wideo AI innowacje takie jak Ray3 podkreślają potencjał rozumowania modeli do wypełnienia luk w kreatywnych narzędziach, nawigacyjnie trwającymi debatami na temat zrównoważonego rozwoju i uczciwości w technologiach generatywnych.

  Apple testuje cztery projekty nadchodzących inteligentnych okularów, które mają konkurować z Meta

Source: Luma AI zaprezentuje model wideo Ray3 Ray3