Dzisiaj Google wprowadził nową technologię skalowania wspieraną przez sztuczną inteligencję, w poście na blogu o nazwie High Fidelity Image Generation Using Diffusion Models, która generuje obrazy o wysokiej wierności z obrazów o niskiej rozdzielczości. Najnowsze badania działu AI Google pokazują, jak nowe postępy w tej dziedzinie umożliwiają tworzenie niesamowitych obrazów. Model uczenia maszynowego firmy jest w stanie wykonać zdjęcie w niemal zerowej rozdzielczości i przeskalować je, aby uzyskać niepowtarzalne szczegóły.
Google wprowadza nową technologię skalowania wspieraną przez sztuczną inteligencję
Jeśli chodzi o skalowanie zdjęć przez sztuczną inteligencję, istnieją różne metody. Ten używany przez firmę nazywa się modelowaniem dyfuzyjnym. Jest to model generatywny, który zaczął być wdrażany w 2015 roku.
Jak wyjaśniają, system pobiera obraz o niskiej rozdzielczości jako dane wejściowe i samodzielnie buduje obraz o wysokiej rozdzielczości. Aby to zrobić, Google twierdzi, że najpierw wyszkolili sztuczną inteligencję, aby obniżyć rozdzielczość obrazów i uczynić je wyjątkowo pikselowanymi. Stamtąd „uczy się odwracać ten proces, zaczynając od czystego szumu i stopniowo usuwając szum, aby osiągnąć docelowy rozkład dzięki wskazówkom wejściowego obrazu o niskiej rozdzielczości”.
Narzędzie Google tworzy obrazy o wysokiej wierności przy użyciu modelowania dyfuzji
Dzięki tej metodzie Google udaje się poprawić zwłaszcza portrety ludzi. Jednak idzie o krok dalej i wykorzystuje drugą sztuczną inteligencję, aby móc jeszcze bardziej poprawić jakość. Na przykład najpierw przekształca obraz o wymiarach 32 x 32 na 64 x 64 i przyjmuje to nowe zdjęcie jako odniesienie do 128 x 128 i tak dalej.
Rezultaty są niewątpliwie spektakularne, pozwala to na tworzenie naprawdę szczegółowych zdjęć praktycznie z niczego. Mimo drobnych błędów zdjęcia bez problemu wyglądają realistycznie. W rzeczywistości, bez znajomości kontekstu, zwykła osoba prawdopodobnie nie zidentyfikowałaby, że została przeskalowana przez sztuczną inteligencję.