Alibaba AI zaprezentowała przełomową technologię o nazwie EMO (skrót od „Emote Portrait Alive”), która ma moc przekształcania statycznych portretów w realistyczne animowane filmy.
Przygotuj się, bo sztuczna inteligencja zmienia sposób, w jaki myślimy o wideo! Firmy takie jak OpenAI i Alibaba zadziwiają nas nowymi narzędziami. Pamiętacie Sorę z OpenAI? Może tworzyć postacie wideo obejmujące całe ciało tylko z tekstu. Teraz Alibaba ma coś, co nazywa się EMO („Emote Portrait Alive”), które może ożywić każdy stary portret.
To ogromna sprawa, zwłaszcza jeśli kochasz kręcić filmy lub fascynuje Cię sztuczna inteligencja. Przyjrzyjmy się, jak działa EMO i jakie szalone rzeczy można z nim zrobić.
Co to jest Alibaba AI EMO (żywy portret emotek)?
EMO to zaawansowany system sztucznej inteligencji opracowany przez Alibaba, który może generować realistyczne filmy mówiące i śpiewające z jednego nieruchomego obrazu. Wykorzystuje generowanie wideo za pomocą gadającej głowy w oparciu o dźwięk, aby tworzyć animacje, które są niezwykle realistyczne.
Przyjrzyjmy się, jak działa EMO:
- Wejście pojedynczego obrazu: Magia EMO zaczyna się od pojedynczego zdjęcia portretowego. Może to być postać historyczna, postać fikcyjna, a nawet Twoje własne zdjęcie
- Wejście audio: Aby ożywić portret, EMO wymaga wejścia audio, mowy lub śpiewu
- magia sztucznej inteligencji: Zaawansowane algorytmy AI firmy EMO analizują zarówno obraz, jak i dźwięk, generując dokładną mimikę twarzy, kształty ust i ruchy głowy, które idealnie synchronizują się z dostarczanym dźwiękiem
Alibaba AI EMO wyróżnia się zdolnością do tworzenia niezwykle realistycznych animacji. Generowane przez nią filmy często są nie do odróżnienia od prawdziwych materiałów, co zaciera granice między treściami opartymi na sztucznej inteligencji a rzeczywistością. Ten poziom realizmu stanowi duży krok naprzód w technologii animacji opartej na sztucznej inteligencji.
Oprócz realistycznych ruchów, EMO z łatwością radzi sobie zarówno ze śpiewem, jak i mówieniem. Niezależnie od tego, czy dostarczysz nagranie mowy, czy piosenkę, EMO animuje portret za pomocą odpowiednich wyrażeń pasujących do dźwięku. Ta wszechstronność sprawia, że jest to potężne narzędzie do różnorodnych zastosowań.
EMO oferuje również elastyczność, umożliwiając określenie czasu trwania animowanego wideo na podstawie długości sygnału wejściowego audio. Oznacza to, że w razie potrzeby możesz tworzyć krótkie klipy lub dłuższe, bardziej szczegółowe animacje.
Czekaj, czy Alibaba ma zespół projektu badawczego AI?
Alibaba prowadzi znaczący projekt badawczy dotyczący sztucznej inteligencji.
W 2017 roku założyli Akademia DAMO (Discovery, Adventure, Momentum, Outlook), globalna inicjatywa badawcza poświęcona badaniu najnowocześniejszych technologii, takich jak sztuczna inteligencja, uczenie maszynowe i inteligencja danych. Alibaba aktywnie wykorzystuje sztuczną inteligencję na swojej ekspansywnej platformie e-commerce oraz w różnych innych obszarach.
Sztuczna inteligencja odgrywa na przykład rolę w optymalizacji tras dostaw i zarządzaniu magazynami w ramach inteligentnych systemów logistycznych. Obsługuje także chatboty i obsługę klienta poprzez przetwarzanie języka naturalnego oraz tworzy spersonalizowane rekomendacje produktów dla klientów. Alibaba demonstruje swoje zaangażowanie w badania nad sztuczną inteligencją, inwestując miliardy dolarów w te wysiłki.
Plaga deepfake’ów
EMO Alibaba AI stwarza poważne ryzyko dla i tak już niepokojącego świata deepfakes. Może znacznie ułatwić tworzenie zwodniczych treści. Dzięki EMO osoba bez rozległej wiedzy technicznej może wygenerować realistycznie wyglądające filmy wideo przedstawiające ludzi mówiących rzeczy, których nigdy nie robili. Zaawansowana technologia animacji w EMO grozi, że te deepfake’i staną się jeszcze bardziej przekonujące, zacierając granicę między tym, co prawdziwe, a tym, co sfabrykowane. Ta umiejętność manipulowania podobieństwem osoby za pomocą samego sygnału audio otwiera drzwi do potencjalnie niszczycielskich fałszywych informacji.
EMO podkreśla alarmujące możliwości manipulacji opartej na sztucznej inteligencji. Tego rodzaju technologia może być niebezpieczna w niepowołanych rękach, co uwydatnia pilną potrzebę wprowadzenia bardziej rygorystycznych przepisów i zabezpieczeń. Potencjalne szkody obejmują proste zabójstwo danej osoby lub kampanie dezinformacyjne na dużą skalę, które mogą całkowicie zdestabilizować zaufanie do mediów. Ważne jest, aby podejść do EMO i podobnych technologii ze szczególną ostrożnością, aby spróbować zapobiec tym negatywnym konsekwencjom.
Zobacz pełny artykuł badawczy tutaj.
Autor wyróżnionego obrazu: Mark Daynes/Usuń rozpryski.
Source: Alibaba AI rywalizuje z OpenAI Sora z EMO