Apple kontynuuje prace nad sztuczną inteligencją pełną parą. Wreszcie uruchomiła nową serię modeli sztucznej inteligencji typu open source o nazwie OpenELM (.
Chcąc zaoferować użytkownikom moc i funkcje sztucznej inteligencji bez konieczności stosowania serwerów w chmurze, Apple twierdzi, że najważniejszą cechą tych modeli jest to, że mogą one pracować na urządzeniu.
W międzyczasie podzieliliśmy się z Wami niedawno wypowiedziami Marka Gurmana z Bloomberga i szczegółami na temat AI LLM w iOS 18. Oto wszystko, co wiemy na temat nowych modeli sztucznej inteligencji.
Co to jest OpenELM?
OpenELM składa się z ośmiu modeli. Cztery z nich są wstępnie przeszkolone, a inne można dostosować za pomocą konkretnych instrukcji i danych wejściowych. Modele są stosunkowo małe (270 milionów do 3 miliardów parametrów) i zoptymalizowane do działania na urządzeniach.
Apple stosuje strategię skalowania opartą na warstwach, aby poprawić dokładność i wydajność modeli.
Z drugiej strony zastosowanie modeli OpenELM oferuje wiele korzyści:
- Przetwarzanie AI na urządzeniu: W modelach OpenELM funkcje AI można wykonywać bezpośrednio na urządzeniu, bez konieczności korzystania z serwerów w chmurze. Znacząco zwiększa to zarówno prywatność, jak i bezpieczeństwo danych.
- Niższe koszty: Mniejsza zależność od serwerów w chmurze skutkuje oszczędnościami kosztów.
- Szybszy czas reakcji: Przetwarzanie danych na urządzeniu umożliwia szybszy czas reakcji i płynniejszą obsługę użytkownika.
- Więcej badań i rozwoju: Modele OpenELM są modelami typu open source, dzięki czemu badacze i programiści mogą je badać i ulepszać. Przyspiesza to rozwój technologii AI i rozwój aplikacji nowej generacji.
Apple stworzyło co następuje oświadczenie o nowych modelach językowych:
Powtarzalność i przejrzystość dużych modeli językowych mają kluczowe znaczenie dla rozwoju otwartych badań, zapewnienia wiarygodności wyników i umożliwienia badania błędów danych i modeli, a także potencjalnych zagrożeń. W tym celu udostępniamy OpenELM, najnowocześniejszy model otwartego języka. OpenELM wykorzystuje strategię skalowania warstwowego, aby efektywnie przydzielać parametry w każdej warstwie modelu transformatora, co prowadzi do zwiększonej dokładności. Na przykład przy budżecie parametrów wynoszącym około miliarda parametrów OpenELM wykazuje poprawę dokładności o 2,36% w porównaniu do OLMo, wymagając jednocześnie 2 razy mniej tokenów przedtreningowych.
Odbiegając od wcześniejszych praktyk, które dostarczały jedynie wagi modeli i kod wnioskowania oraz trenowały wstępnie na prywatnych zbiorach danych, nasza wersja zawiera pełną platformę do uczenia i ewaluacji modelu językowego na publicznie dostępnych zbiorach danych, w tym dzienniki szkoleniowe, wiele punktów kontrolnych i szkolenia wstępne konfiguracje. Udostępniamy także kod umożliwiający konwersję modeli do biblioteki MLX w celu wnioskowania i dostrajania na urządzeniach Apple. Celem tej kompleksowej publikacji jest wzmocnienie pozycji społeczności otwartych badaczy i utorowanie drogi przyszłym wysiłkom w zakresie otwartych badań naukowych.
Ponadto, jeśli chcesz dowiedzieć się więcej o OpenELM, możesz to sprawdzić szczegółowy raport.
Apple planuje udostępnić modele OpenELM w systemie operacyjnym iOS 18. Oczekuje się, że iOS 18 będzie zawierał znaczące ulepszenia skupione na sztucznej inteligencji i będzie obsługiwał duży model językowy (LLM) na urządzeniu.
Modele OpenELM uważane są za ważny krok w kierunku przyszłości sztucznej inteligencji. Oczekuje się, że dzięki nowym modelom sztuczna inteligencja stanie się bardziej prywatna, bezpieczna i dostępna.
Posunięcie Apple może mieć znaczenie w rozpowszechnianiu sztucznej inteligencji i włączaniu jej do każdego aspektu codziennego życia.
Autor wyróżnionego obrazu: Keming Tan / Unsplash
Source: Apple wypuszcza nową serię modeli sztucznej inteligencji typu open source o nazwie OpenELM