Integracja DALL-E API została ogłoszona przez OpenAI. Deweloperzy będą mogli korzystać z DALL-E bezpośrednio w swoich aplikacjach dzięki nowemu interfejsowi API.
Dostęp do interfejsu DALL-E API jest teraz w publicznej wersji beta
Jak być może już wiesz, dostęp DALL-E 2 został ostatnio udostępniony wszystkim! Jednak wraz z tym nowym ogłoszeniem do GPT-3, Embeddings i Codex dołączył DALL-E, model języka transformatora, który umożliwia użytkownikom wykorzystywanie podpowiedzi w języku naturalnym do generowania i modyfikowania oryginalnych obrazów.
„Ponad 3 miliony osób korzysta już z DALL·E, aby zwiększyć swoją kreatywność i przyspieszyć przepływ pracy, generując ponad 4 miliony obrazów dziennie. Deweloperzy mogą zacząć budować w tej samej technologii w ciągu kilku minut.” stwierdził OpenAI.
Udostępnili ten kod i obraz wyjściowy jako przykład:
- Wyjście:
Co DALL-E API oferuje programistom?
Dzięki wszechstronności DALL-E użytkownicy mogą tworzyć i modyfikować unikalne obrazy, od kreatywnych po fotorealistyczne. DALL-E doskonale nadaje się do wykonywania instrukcji w języku naturalnym, pozwalając użytkownikom precyzyjnie określić, co chcą zobaczyć. W miarę postępu badań OpenAI będą aktualizować interfejs API, aby odzwierciedlać najnowsze osiągnięcia w zakresie jakości obrazu, opóźnień, skalowalności i użyteczności.
Wbudowana moderacja
Deweloperzy mogą śmiało dostarczać swoje aplikacje, wiedząc, że wbudowane środki łagodzące — takie jak filtry symboli nienawiści i krwi — poradzą sobie z trudnymi aspektami moderacji, uwzględniając lekcje zaufania i bezpieczeństwa, które zdobyliśmy podczas dystrybucji DALL-E do 3 milionów artystów i użytkowników na całym świecie. W ramach naszego zaangażowania w odpowiedzialne wdrażanie w OpenAI będziemy nadal stawiać zaufanie i bezpieczeństwo na pierwszym miejscu, aby programiści mogli skoncentrować się na tworzeniu.
Aplikacje DALL-E
OpenAI ściśle współpracował z wybraną grupą wczesnych użytkowników, którzy już zintegrowali DALL-E z szeregiem aplikacji i produktów.
Microsoft integruje DALL-E API z Designer, zupełnie nowym narzędziem do projektowania graficznego, które umożliwia użytkownikom tworzenie zaproszeń, zdjęć, cyfrowych pocztówek, postów w mediach społecznościowych i bardziej profesjonalnie.
Ponadto Microsoft integruje DALL-E API z Bing i Microsoft Edge z Image Creator, umożliwiając użytkownikom tworzenie obrazów w przypadku, gdy wyniki w Internecie nie zapewniają tego, czego szukają.
Pierwszy na świecie modowy i lifestylowy system operacyjny nazywa się CALA. CALA łączy cały proces projektowania na jednej platformie cyfrowej, począwszy od koncepcji produktu, poprzez uruchomienie handlu elektronicznego i realizację zamówień. Użytkownicy mogą tworzyć świeże koncepcje projektowe na podstawie przesłanych zdjęć referencyjnych lub naturalnie występujących opisów językowych, korzystając z nowych technologii sztucznej inteligencji CALA wspieranych przez DALL-E API.
Szybko rozwijający się start-up fotograficzny o nazwie Mixtiles również wykorzystuje DALL-E API. Miliony osób mogą z ich pomocą tworzyć oszałamiające ściany ze zdjęciami dzięki oprogramowaniu i łatwemu procesowi zawieszania. Prowadząc ludzi przez proces twórczy, który rejestruje wczesne wspomnienia, fantastyczne miejsca i nie tylko, Mixtiles wykorzystuje interfejs API DALL-E do generowania i kadrowania emocjonalnie rezonującej grafiki.
„Jesteśmy podekscytowani, widząc, co nasi klienci zrobią z DALL·E i jakie kreatywne pomysły wymyślą”, powiedział OpenAI w oświadczeniu.
Cennik interfejsu DALL-E API
Rozmiar obrazu wyjściowego określa cenę interfejsu API DALL-E. Chociaż istnieją niewielkie rabaty na 512 x 512 przy 0,018 USD za obraz i 256 x 256 za 0,016 USD za obraz, 1024 x 1024 kosztuje 0,02 USD za obraz.
Luke Miller, menedżer produktu w OpenAI powiedział VentureBeat że API ma trzy funkcje. Użytkownicy mogą tworzyć obraz, zmieniać jego fragment i tworzyć wiele wersji tego samego obrazu.
„Można myśleć o tym jak o procesie twórczym, wymyślaniu pomysłów, wybieraniu czegoś i zawężaniu się, a następnie kontynuowaniu iteracji i znajdowaniu czegoś, co pasuje do twoich potrzeb i danego kontekstu” – stwierdził.
Według Rowana Currana, eksperta ds. AI i ML w Forrester Research, będzie to „niezwykle przydatne” dla programistów, jeśli DALL-E API umożliwi edycję i ulepszanie obrazów.
W przeszłości Curran odnotował koszt związany z utrzymaniem dużych modeli językowych jako jedno z ich ogólnych ograniczeń. Dlatego powiedział, że API DALL-E „otworzy cały zestaw przypadków użycia, szczególnie dla startupów i osób, które otrzymują finansowanie zalążkowe”.
Dokumentacja DALL-E API
Programiści mogą zapoznać się z całą dokumentacją wyjaśniającą DALL-E API używając tego linku. Kiedy DALL-E 2 wprowadził malowanie, byliśmy naprawdę podekscytowani. Z niecierpliwością czekamy na efekty tego nowego skoku OpenAI.
Source: Publiczna wersja beta DALL-E API została ogłoszona przez OpenAI