Dziedzina AI przeszła dużą zmianę wraz z wprowadzeniem CogVideoX-5B. Ten model AI, opracowany przez badaczy z Tsinghua University i Zhipu AI, może zmienić sposób tworzenia filmów i krajobraz treści cyfrowych. Czym jest CogVideoX-5B i dlaczego jest tak popularny?
CogVideoX-5B jest inny, ponieważ jest dostępny i ma imponujące możliwości. Ten model może tworzyć wysokiej jakości filmy o długości do sześciu sekund z prostego tekstu. Ma to duże implikacje. Model jest open source, więc mogą go używać deweloperzy na całym świecie. Dzięki temu tworzenie filmów staje się łatwiejsze dla każdego.
CogVideoX-5B をお試し中。https://t.co/e3bNKp3adp
Puszysty biały kotek z różową wstążką zawiązaną wokół szyi bawi się na poduszce przy oświetlonym słońcem oknie, a jego miękkie futro świeci w świetle. Scena zaczyna się z niewielkiej odległości, stopniowo powiększając się, gdy kotek macha małym… fot.twitter.com/1x1y3mqFA6
— 布留川英一 / Hidekazu Furukawa (@npaka123) 28 sierpnia 2024 r.
Co sprawia, że działa on wewnątrz CogVideoX-5B?
CogVideoX-5B model ma 5 miliardów parametrówModel może produkować filmy w Rozdzielczość 720×480 I 8 klatek na sekundę. Ten model nie jest najlepszy, ale nadal jest dobry, zwłaszcza ponieważ jest to oprogramowanie typu open source.
Sukces CogVideoX-5B wynika z kilku innowacji technicznych. Model wykorzystuje Autoenkoder wariacyjny 3D (VAE) do kompresji danych wideo, co ułatwia generowanie wysokiej jakości wyniki. Używa również „ekspert transformator„z adaptacją WarstwaNormco pozwala modelowi interpretować tekst z większą szczegółowością, czego efektem są dokładniejsze i bardziej spójne filmy.
Decyzja o udostępnieniu CogVideoX-5B jako open-source to duży krok dla AI. Naukowcy z Uniwersytet Tsinghua I Zhipu AI upublicznili swoje kody i wagi modeli, ułatwiając innym korzystanie z zaawansowanej technologii generowania wideo. Oznacza to, że programiści mogą teraz eksperymentować z treścią wideo generowaną przez AI. To podejście typu open source może doprowadzić do powstania nowych narzędzi i aplikacji w wielu branżach.
Stworzone przez CogVideoX-5B! fot.twitter.com/Y22zcg8fBA
— F-AI (@faiAI0) 28 sierpnia 2024 r.
CogVideoX-5B: Jak wypada w porównaniu i kto go stworzył
CogVideoX-5B nie jest pierwszym modelem text-to-video, ale okazuje się być jednym z najbardziej wpływowych. Przewyższył konkurentów, takich jak WideoCrafter-2.0 I OtwórzSora. Jest to spowodowane nowymi technikami stosowanymi przez deweloperów. Naukowcy z Uniwersytetu Tsinghua i Zhipu AI stworzyli narzędzie, które może zmienić sposób produkcji i konsumpcji treści cyfrowych.
Jak rozpocząć pracę z CogVideoX-5B
Możesz używać i eksperymentować z modelem CogVideoX-5B za darmo. Oto prosty przewodnik, jak zacząć:
- Odwiedź repozytorium GitHub:Kod CogVideoX-5B i wagi modeli są dostępne GitHub. Pobierz je na swój komputer.
- Skonfiguruj swoje środowisko: Upewnij się, że masz odpowiednie narzędzia do uruchomienia modelu. Może to obejmować określone wersje Pyton i biblioteki takie jak PyTorch.
- Uruchom model:Wprowadź tekst podpowiedzi i generuj filmy korzystając z instrukcji w repozytorium.
- Eksperymentuj i innowuj:Gdy już poznasz podstawy, wypróbuj różne komunikaty tekstowe, aby zobaczyć, co potrafi model.
CogVideoX-5B (txt2vid) został dodany do darmowego dodatku do Blendera, Pallaidium: #b3d fot.twitter.com/ynBupL2TKT
— tintwotin (@tintwotin) 27 sierpnia 2024 r.
Jak wypróbować CogVideoX-5B online
Jeśli nie chcesz pobierać CogVideoX-5B, możesz wypróbować go online przez Hugging Face. Oto przewodnik, jak korzystać z wersji demonstracyjnej:
- Odwiedź stronę demonstracyjną:Idź do CogVideoX-5B Przytulanie twarzy.
- Wprowadź swój tekst monitu:W „Podpowiedź” w polu opisz film, który chcesz wygenerować. Aby uzyskać najlepsze wyniki, ogranicz go do 200 słów.
- Ulepsz swój monit (opcjonalnie): Kliknij „Ulepsz monit”, aby dopracować wprowadzone dane i nadpisać oryginalny monit.
- Ustaw ziarno wnioskowania (opcjonalnie): Aby kontrolować losowość generowania wideo, wprowadź liczbę dodatnią w polu „Inference Seed”. Jeśli wolisz losowy seed, pozostaw wartość jako
-1
.
- Włącz dodatkowe funkcje (opcjonalnie):
- Super rozdzielczość: Zaznacz to pole, aby zwiększyć rozdzielczość wideo z 720×480 do 1440×960.
- Interpolacja klatek: Włącz tę opcję, aby poprawić wyjście wideo poprzez zwiększenie liczby klatek na sekundę (z 8 FPS do 16 FPS).
- Wygeneruj swój film: Po zakończeniu kliknij „Generuj wideo”. Modelka utworzy krótki film na podstawie Twojego polecenia.
- Obejrzyj wideo: Po wygenerowaniu wyświetl podgląd wideo na stronie. Dostosuj dane wejściowe i spróbuj ponownie, aby uzyskać pożądany wynik.
CogVideoX-5B i podobne produkty
CogVideoX-5B to kolejny model AI, który zmienia to, co jest możliwe w tworzeniu treści cyfrowych. Inne godne uwagi modele to narzędzia do generowania wideo Runway, Luma AI, WideoCrafter2i Pika Labs. Każdy model ma swoje mocne strony, ale nowa sztuczna inteligencja jest open-source, co ułatwia jej używanie i pozwala większej liczbie osób przyczynić się do jej rozwoju.
Ta firma to ważny krok naprzód w dziedzinie wideo generowanego przez AI. Jej podejście open-source ułatwia korzystanie z niej każdemu i pomaga jej w ciągłym doskonaleniu. W miarę jak coraz więcej osób zacznie z niej korzystać, tworzenie wideo stanie się bardziej zróżnicowane, dynamiczne i dostępne.
Źródło wyróżnionego obrazu: Wideo CogX
Source: Jak CogVideoX-5B ma na zawsze zrewolucjonizować tworzenie filmów