Microsoft VASA-1 ożywia zdjęcia: wszystko, co musisz wiedzieć

Ponieważ technologie sztucznej inteligencji szybko ewoluują i przesuwają granice, nowy projekt Microsoftu, VASA-1, umożliwia przekształcanie zdjęć w filmy i dodawanie do nich realistycznych dźwięków. Tak, dobrze słyszałeś.

Ta ekscytująca technologia wykorzystuje zdjęcie portretowe i plik audio do stworzenia wideo mówiącej twarzy z realistyczną synchronizacją ust, mimiką i ruchami głowy.

Obiecana moc VASA-1 budzi pewne obawy, które sprawiły, że Microsoft wahał się przed jej wypuszczeniem. Oto, co wiemy…

Zdolności i wpływ VASA-1

Najbardziej uderzającą cechą VASA-1 jest jego zdolność do tworzenia realistycznych animacji twarzy. W przeciwieństwie do poprzednich modeli AI, VASA-1 oferuje bardziej naturalny wygląd, minimalizując błędy wokół ust. Może to doprowadzić do szerszego rozpowszechnienia w Internecie bardziej realistycznych filmów typu deepfake.

Dzięki nowej technologii Microsoftu możliwe są realistyczne rezultaty o wysokiej jakości. Filmy demonstracyjne firmy dostarczają imponujących przykładów, które zacierają granice między rzeczywistością a treściami generowanymi przez sztuczną inteligencję.

Ciekawie będzie zobaczyć, co szykują dla nas Sora z OpenAI i VASA-1 Microsoftu w nadchodzących latach…

Firma wyjaśniła w poście na blogu w następujący sposób:

Prawie wszystkie urządzenia Bluetooth są narażone na nowe naruszenie

Uwaga: wszystkie obrazy portretowe na tej stronie są wirtualnymi, nieistniejącymi tożsamościami wygenerowanymi przez StyleGAN2 lub DALL·E-3 (z wyjątkiem Mona Lisy). Badamy generowanie wizualnych umiejętności emocjonalnych dla wirtualnych, interaktywnych postaci, które NIE naśladują żadnej osoby ze świata rzeczywistego. To tylko demonstracja badawcza i nie planuje się wypuszczania żadnych produktów ani interfejsów API.

Obszary zastosowań VASA-1

Zastosowania VASA-1 są ogromne i mogą przesuwać granice kreatywności. Można go na przykład wykorzystać do zapewnienia lepszych wrażeń z gier. Zwiększenie realizmu postaci w grze dzięki zsynchronizowanym ruchom warg i wyrazistej mimice może odmienić świat gier. Nawet teraz postacie w grach są niesamowicie zoptymalizowane. Jednak dzięki tej technologii prawdopodobnie udoskonalą się jeszcze bardziej.

Z drugiej strony można również tworzyć spersonalizowane wirtualne awatary. Użytkownicy mogą coś zmienić w mediach społecznościowych, tworząc realistyczne awatary, które odzwierciedlają ich własny wygląd. Zaskakujące zmiany można było zaobserwować także w branży filmowej. VASA-1 może przesuwać granice kinematografii, tworząc realistyczne zbliżenia, mimikę i naturalne sekwencje dialogów.

Jak działa technologia i przyszłość

Microsoft twierdzi, że VASA-1 oferuje nową platformę do tworzenia realistycznych gadających twarzy i animowania wirtualnych postaci. Technologia ma na celu osiągnięcie imponujących rezultatów przy użyciu wyłącznie zdjęcia portretowego i pliku audio. Powszechne stosowanie tej technologii budzi jednak pewne obawy. W szczególności możliwość niewłaściwego wykorzystania technologii takich jak deepfake skłania firmę Microsoft do zachowania ostrożności.

Google zamyka projekt Musetter już po trzech miesiącach od jego uruchomienia

Jednym z wyzwań stojących przed Microsoftem jest zrównoważenie innowacji z odpowiedzialnością. Dostrzegając potencjalne korzyści, jakie niesie ze sobą technologia, firma odpowiedzialnie podchodzi do rozwoju i stara się informować użytkowników o potencjalnych zagrożeniach. W ten sposób ma na celu utrzymanie w ryzach rozpowszechniania potężnej technologii, takiej jak VASA-1, zapewniając ogólne bezpieczeństwo społeczeństwa.

Autor wyróżnionego obrazu: Microsoftu

Source: Microsoft VASA-1 ożywia zdjęcia: wszystko, co musisz wiedzieć

Microsoft VASA-1 ożywia zdjęcia: wszystko, co musisz wiedzieć

Zdolności i wpływ VASA-1

Obszary zastosowań VASA-1

Jak działa technologia i przyszłość

© 2021 TechBriefly is a Linkmedya brand.

Follow Us