Ponieważ technologie sztucznej inteligencji szybko ewoluują i przesuwają granice, nowy projekt Microsoftu, VASA-1, umożliwia przekształcanie zdjęć w filmy i dodawanie do nich realistycznych dźwięków. Tak, dobrze słyszałeś.
Ta ekscytująca technologia wykorzystuje zdjęcie portretowe i plik audio do stworzenia wideo mówiącej twarzy z realistyczną synchronizacją ust, mimiką i ruchami głowy.
Obiecana moc VASA-1 budzi pewne obawy, które sprawiły, że Microsoft wahał się przed jej wypuszczeniem. Oto, co wiemy…
Zdolności i wpływ VASA-1
Najbardziej uderzającą cechą VASA-1 jest jego zdolność do tworzenia realistycznych animacji twarzy. W przeciwieństwie do poprzednich modeli AI, VASA-1 oferuje bardziej naturalny wygląd, minimalizując błędy wokół ust. Może to doprowadzić do szerszego rozpowszechnienia w Internecie bardziej realistycznych filmów typu deepfake.
Dzięki nowej technologii Microsoftu możliwe są realistyczne rezultaty o wysokiej jakości. Filmy demonstracyjne firmy dostarczają imponujących przykładów, które zacierają granice między rzeczywistością a treściami generowanymi przez sztuczną inteligencję.
Ciekawie będzie zobaczyć, co szykują dla nas Sora z OpenAI i VASA-1 Microsoftu w nadchodzących latach…
Uwaga: wszystkie obrazy portretowe na tej stronie są wirtualnymi, nieistniejącymi tożsamościami wygenerowanymi przez StyleGAN2 lub DALL·E-3 (z wyjątkiem Mona Lisy). Badamy generowanie wizualnych umiejętności emocjonalnych dla wirtualnych, interaktywnych postaci, które NIE naśladują żadnej osoby ze świata rzeczywistego. To tylko demonstracja badawcza i nie planuje się wypuszczania żadnych produktów ani interfejsów API.
Obszary zastosowań VASA-1
Zastosowania VASA-1 są ogromne i mogą przesuwać granice kreatywności. Można go na przykład wykorzystać do zapewnienia lepszych wrażeń z gier. Zwiększenie realizmu postaci w grze dzięki zsynchronizowanym ruchom warg i wyrazistej mimice może odmienić świat gier. Nawet teraz postacie w grach są niesamowicie zoptymalizowane. Jednak dzięki tej technologii prawdopodobnie udoskonalą się jeszcze bardziej.
Z drugiej strony można również tworzyć spersonalizowane wirtualne awatary. Użytkownicy mogą coś zmienić w mediach społecznościowych, tworząc realistyczne awatary, które odzwierciedlają ich własny wygląd. Zaskakujące zmiany można było zaobserwować także w branży filmowej. VASA-1 może przesuwać granice kinematografii, tworząc realistyczne zbliżenia, mimikę i naturalne sekwencje dialogów.
Jak działa technologia i przyszłość
Microsoft twierdzi, że VASA-1 oferuje nową platformę do tworzenia realistycznych gadających twarzy i animowania wirtualnych postaci. Technologia ma na celu osiągnięcie imponujących rezultatów przy użyciu wyłącznie zdjęcia portretowego i pliku audio. Powszechne stosowanie tej technologii budzi jednak pewne obawy. W szczególności możliwość niewłaściwego wykorzystania technologii takich jak deepfake skłania firmę Microsoft do zachowania ostrożności.
Jednym z wyzwań stojących przed Microsoftem jest zrównoważenie innowacji z odpowiedzialnością. Dostrzegając potencjalne korzyści, jakie niesie ze sobą technologia, firma odpowiedzialnie podchodzi do rozwoju i stara się informować użytkowników o potencjalnych zagrożeniach. W ten sposób ma na celu utrzymanie w ryzach rozpowszechniania potężnej technologii, takiej jak VASA-1, zapewniając ogólne bezpieczeństwo społeczeństwa.
Autor wyróżnionego obrazu: Microsoftu
Source: Microsoft VASA-1 ożywia zdjęcia: wszystko, co musisz wiedzieć