Meta, gigant technologiczny znany z kształtowania metaświata, niedawno ujawnił niezwykły postęp w sztucznej inteligencji: Emu AI, skrót od Ekspresyjny wszechświat mediów.
Ten najnowocześniejszy model sztucznej inteligencji jest do tego gotowy zrewolucjonizują proces generowania obrazów z opisów tekstowych.
Strojenie jakości za pomocą Emu AI
U podstaw pomysłowości Emu leży technika znana jako „dostrajanie jakości”. To innowacyjne podejście znacznie poprawiato wizualna atrakcyjność obrazów generowanych przez modele zamiany tekstu na obraz AI. Wyniki są nie tylko efektowne wizualnie, ale także niezwykle wierne dostarczonemu tekstowi.
W ramach szeroko zakrojonych badań zespół Meta zajmujący się sztuczną inteligencją wyruszył w podróż, która rozpoczęła się od wstępne uczenie modelu dyfuzji ukrytej. Ta początkowa faza obejmowała kolosalny zbiór danych obejmujący oszałamiające 1,1 miliarda par obraz-tekst. Jednakże, prawdziwy przełom nastąpił na etapie dostrajania, na którym system przeszedł szkolenie wyselekcjonowany wybór zaledwie 2000 starannie wybranych obrazów wysokiej jakości.
Łączenie technologii z ludzką wiedzą
Proces ten określa się mianem znajdowania „fotogeniczne igły w stogu siana”, łączy najnowocześniejszą technologię z niezbędnym ludzkim dotykiem. Początkowy zbiór danych był obszerny i obejmował miliardy obrazów. Jednak to już koniec szereg automatycznych filtrów że to źródło obrazów zostało udoskonalone. Czynniki takie jak treści obraźliwe, dopasowanie obrazu do tekstu, I nakładka tekstowa zostały zbadane. Jednakże ograniczenia automatycznego filtrowania były oczywiste, co prowadzi do krytycznego włączenia ludzkich adnotatorów.
Grali komentatorzy, od generalistów po specjalistów kluczową rolę w procesie selekcji. Ich wnikliwe oczy zapewniły tylko crème de la crème – obrazy, które przekroczyły ‘Dobry’ osiągnąć ‘wyjątkowy’ status – dokonano ostatecznego cięcia. Na końcu, pozostało zaledwie 2000 obrazów, każdy ma niezaprzeczalny urok.
Pseudonim wyróżniający
Wybór „Emu” jako pseudonimu dla tego przełomowego modelu to: symboliczny. Oddaje hołd emu, ptak znany ze swojej charakterystycznej, przyciągającej uwagę natury. Ten wybór odzwierciedla zdolność Emu przykuć uwagę I wyróżniają się w obszarze generowania obrazu.
Triumf Emu AI nad nowoczesnością
Możliwości Emu AI wykraczają poza sferę fotorealistycznych ustawień, ponieważ przodują nawet w nich tworzenie szkiców i rysunków. Oceny porównawcze w stosunku do najnowocześniejszy model SDXL1.0 przyniosło niezwykłe rezultaty. Preferowanym wyborem okazała się emu, ze znaczącym udziałem Stopa preferencji 68,4%. dla atrakcyjności wizualnej w teście porównawczym PartiPrompts i jest jeszcze bardziej imponujący Stopa preferencji 71,3%. w swoim teście porównawczym Open User input.
Badacze Meta przypisują wyjątkową wydajność Emu nie tylko architekturze modelu, ale także, co najważniejsze, samej architekturze jakość i różnorodność danych wykorzystywanych do dostrajania. Co zaskakujące, wpływ zaledwie 100 wysokiej jakości obrazów szkoleniowych na temat możliwości wytwórczych Emu AI była znaczna. Podkreśla to siłę wybranego zestawu przykładowych przykładów w dostosowywaniu kreatywności sztucznej inteligencji do ludzkiej estetyki.
Wieloaspektowy kunszt Emu
Jedną z najbardziej godnych pochwały cech Emu jest jego wszechstronność. Pokazuje zdolność do przedstawiania szeroki wachlarz koncepcji, począwszy od portrety Do rozległe krajobrazy I nawet sztuka abstrakcyjna. Ta wszechstronność pozycjonuje Emu jako potężne narzędzie artyści, projektanci, I twórcy w całym spektrum dyscyplin wizualnych.
Pionier przyszłości kreatywności opartej na sztucznej inteligencji
Emu reprezentuje znaczący skok dla Meta w kierunku sztucznej inteligencji, która może płynnie przekształcaj pomysły w urzekającą wizualnie treść. Służy jako świadectwo wartości skrupulatnej selekcji zbiorów danych uczenia maszynowego. Co więcej, zapewnia kuszący wgląd w przyszłość, w której sam tekst może wystarczyć do urzeczywistnienia naszych wyobrażeniowych wizji.
Obiecując, że funkcjonalność Emu będzie wkrótce dostępna za pośrednictwem chatbota Meta AI demokratyzować tworzenie oszałamiających wizualnie treści w niezliczonej liczbie aplikacji i urządzeń.
Autor wyróżnionego obrazu: Meta
Source: Emu AI dość spektakularnie dołącza do wyścigu GenAI