Meta, gigant technologiczny znany z kształtowania metaświata, niedawno ujawnił niezwykły postęp w sztucznej inteligencji: Emu AI, skrót od Ekspresyjny wszechświat mediów.

Ten najnowocześniejszy model sztucznej inteligencji jest do tego gotowy zrewolucjonizują proces generowania obrazów z opisów tekstowych.

Emu AI
Emu AI ma potencjał, aby całkowicie zmienić sposób tworzenia obrazów na podstawie opisów tekstowych (Kredyt obrazu)

Strojenie jakości za pomocą Emu AI

U podstaw pomysłowości Emu leży technika znana jako „dostrajanie jakości”. To innowacyjne podejście znacznie poprawiato wizualna atrakcyjność obrazów generowanych przez modele zamiany tekstu na obraz AI. Wyniki są nie tylko efektowne wizualnie, ale także niezwykle wierne dostarczonemu tekstowi.

W ramach szeroko zakrojonych badań zespół Meta zajmujący się sztuczną inteligencją wyruszył w podróż, która rozpoczęła się od wstępne uczenie modelu dyfuzji ukrytej. Ta początkowa faza obejmowała kolosalny zbiór danych obejmujący oszałamiające 1,1 miliarda par obraz-tekst. Jednakże, prawdziwy przełom nastąpił na etapie dostrajania, na którym system przeszedł szkolenie wyselekcjonowany wybór zaledwie 2000 starannie wybranych obrazów wysokiej jakości.

  Baldur's Gate 3 nagość wywołuje debatę: odpowiednia czy nadmierna?

Łączenie technologii z ludzką wiedzą

Proces ten określa się mianem znajdowania „fotogeniczne igły w stogu siana”, łączy najnowocześniejszą technologię z niezbędnym ludzkim dotykiem. Początkowy zbiór danych był obszerny i obejmował miliardy obrazów. Jednak to już koniec szereg automatycznych filtrów że to źródło obrazów zostało udoskonalone. Czynniki takie jak treści obraźliwe, dopasowanie obrazu do tekstu, I nakładka tekstowa zostały zbadane. Jednakże ograniczenia automatycznego filtrowania były oczywiste, co prowadzi do krytycznego włączenia ludzkich adnotatorów.

Grali komentatorzy, od generalistów po specjalistów kluczową rolę w procesie selekcji. Ich wnikliwe oczy zapewniły tylko crème de la crème – obrazy, które przekroczyły ‘Dobry’ osiągnąć ‘wyjątkowy’ status – dokonano ostatecznego cięcia. Na końcu, pozostało zaledwie 2000 obrazów, każdy ma niezaprzeczalny urok.

Emu AI
Emu, ptak znany ze swojej niezwykłej, przyciągającej uwagę natury, został uhonorowany pseudonimem Emu AI (Kredyt obrazu)

Pseudonim wyróżniający

Wybór „Emu” jako pseudonimu dla tego przełomowego modelu to: symboliczny. Oddaje hołd emu, ptak znany ze swojej charakterystycznej, przyciągającej uwagę natury. Ten wybór odzwierciedla zdolność Emu przykuć uwagę I wyróżniają się w obszarze generowania obrazu.

  Najbardziej przydatne aplikacje dla studentów

Triumf Emu AI nad nowoczesnością

Możliwości Emu AI wykraczają poza sferę fotorealistycznych ustawień, ponieważ przodują nawet w nich tworzenie szkiców i rysunków. Oceny porównawcze w stosunku do najnowocześniejszy model SDXL1.0 przyniosło niezwykłe rezultaty. Preferowanym wyborem okazała się emu, ze znaczącym udziałem Stopa preferencji 68,4%.dla atrakcyjności wizualnej w teście porównawczym PartiPrompts i jest jeszcze bardziej imponujący Stopa preferencji 71,3%. w swoim teście porównawczym Open User input.

Badacze Meta przypisują wyjątkową wydajność Emu nie tylko architekturze modelu, ale także, co najważniejsze, samej architekturze jakość i różnorodność danych wykorzystywanych do dostrajania. Co zaskakujące, wpływ zaledwie 100 wysokiej jakości obrazów szkoleniowych na temat możliwości wytwórczych Emu AI była znaczna. Podkreśla to siłę wybranego zestawu przykładowych przykładów w dostosowywaniu kreatywności sztucznej inteligencji do ludzkiej estetyki.

Wieloaspektowy kunszt Emu

Jedną z najbardziej godnych pochwały cech Emu jest jego wszechstronność. Pokazuje zdolność do przedstawiania szeroki wachlarz koncepcji, począwszy od portrety Do rozległe krajobrazy I nawet sztuka abstrakcyjna. Ta wszechstronność pozycjonuje Emu jako potężne narzędzie artyści, projektanci, I twórcy w całym spektrum dyscyplin wizualnych.

  Wyciekły specyfikacje zegarka OnePlus: monitorowanie snu, stresu i saturacji krwi
Emu AI
Emu AI to ważny krok dla Meta w tworzeniu sztucznej inteligencji, która bez wysiłku zamienia pomysły w urzekającą wizualnie treść (Kredyt obrazu)

Pionier przyszłości kreatywności opartej na sztucznej inteligencji

Emu reprezentuje znaczący skok dla Meta w kierunku sztucznej inteligencji, która może płynnie przekształcaj pomysły w urzekającą wizualnie treść. Służy jako świadectwo wartości skrupulatnej selekcji zbiorów danych uczenia maszynowego. Co więcej, zapewnia kuszący wgląd w przyszłość, w której sam tekst może wystarczyć do urzeczywistnienia naszych wyobrażeniowych wizji.

Obiecując, że funkcjonalność Emu będzie wkrótce dostępna za pośrednictwem chatbota Meta AI demokratyzować tworzenie oszałamiających wizualnie treści w niezliczonej liczbie aplikacji i urządzeń.

Autor wyróżnionego obrazu: Meta

Source: Emu AI dość spektakularnie dołącza do wyścigu GenAI