Meta AI Llama 3.1 405b to hit, który zrobił wrażenie na wielu użytkownikach. Nowy model nie jest małym frytkiem – to duża ryba w stale rosnącej puli modeli językowych. Przyjrzyjmy się AI, która sprawia, że wszyscy mówią i piszą.
Meta AI’s Llama 3.1 405b to, jak sama nazwa wskazuje, duży model językowy z 405 miliardami parametrów. Jest częścią serii Meta’s Llama 3, wprowadzonej na rynek w kwietniu 2024 r. Wczesne testy porównawcze sugerują, że ten model może prześcignąć obecnych liderów w kilku kluczowych testach AI.
Koń o innym kolorze: specyfikacje Llama 3.1 405b Meta AI
Meta AI, wcześniej znana jako Facebook AI Research, to dział badań nad sztuczną inteligencją Meta Platforms. Wprowadzili oni Llama (Large Language Model Meta AI) w 2023 r. jako alternatywę open-source dla zastrzeżonych modeli językowych. Llama szybko zyskała popularność w społeczności AI. Opierając się na tym sukcesie, Meta wydała Llama 2 w 2023 r., która wykazała znaczące ulepszenia.
Teraz, dzięki Llama 3, Meta przesunęła granice jeszcze dalej, co osiągnęło punkt kulminacyjny w potężnym modelu Llama 3.1 405b, który omawiamy dzisiaj. Ten szybki postęp pokazuje zaangażowanie Meta w rozwijanie technologii open source AI.
W tej erze, w której sztuczna inteligencja jest wszędzie wokół nas, firmy nie przestają. W erze, w której patrzymy na grafikę starych gier i zastanawiamy się, ile jeszcze można by ulepszyć, wybaczamy nowej grafice, a to samo dotyczy sztucznej inteligencji.
Meta AI nie jest żadnym niedorajdą, jeśli chodzi o wydajność. Ten model ma 405 miliardów parametrów, co czyni go ciężkim graczem na arenie AI. Co zatem oznacza parametr 405b?
Sąsiad nie mówi nigdy: Llama 3.1 405b Meta AI kontra konkurenci
Lama 3.1 405b Meta AI wykazuje imponujące wyniki we wczesnych testach porównawczych. Przewyższa GPT-4 w kilku testach, w tym GSM8K, Hellaswag, Boolq i różnych kategoriach MMLU. Jednak pozostaje w tyle w takich obszarach jak HumanEval i nauki społeczne MMLU.
Wydajność modelu jest szczególnie wysoka w zadaniach matematycznych i kodowania. Na przykład w teście GSM8K, Meta AI’s Llama 3.1 405b uzyskała 96,8, podczas gdy jej odpowiednik 70B osiągnął 94,8. W HumanEval, model 405B osiągnął 85,3, w porównaniu do 79,3 dla wersji 70B.
Te liczby są oparte na modelu bazowym. Strojenie instrukcji mogłoby potencjalnie poprawić te wyniki jeszcze bardziej. Możemy więc powiedzieć, że te liczby przedstawiają moc przetwarzania, im większa liczba, tym lepiej (ale czasami), ale czasami modele są miażdżone pod swoim obciążeniem.

Hoof It ku przyszłości: Llama 3.1 405b firmy Meta AI i sztuczna inteligencja typu open source
Fakt, że model Llama 3.1 405b Meta AI jest AI typu open-source i że po raz pierwszy model typu open-source może pokonać najlepszy zamknięty kod źródłowy LLM dostępny w różnych testach porównawczych, może być oznaką nadchodzących wydarzeń, nawet jeśli nie są w pełni zrozumiane w tej chwili. Na razie możemy tworzyć nasze GPT w ChatGPT. Ta zależność może zostać zerwana w przyszłości.
Meta AI’s Llama 3.1 405b to silny nowy gracz w przestrzeni AI. Jego wysoka wydajność w różnych testach porównawczych i natura open-source sprawiają, że jest to model, który warto obserwować. W miarę rozwoju AI, Meta AI’s Llama 3.1 405b może odegrać ważną rolę w kształtowaniu przyszłości modeli językowych i technologii AI.
Źródło wyróżnionego obrazu: Blog Meta AI
Source: Meta AI Llama 3.1 405b osiąga wyniki testów porównawczych





