Reflection 70B robi to, czego nie potrafią wielcy chłopcy i uczy się na własnych błędach. Ta sztuczna inteligencja z modelami języka open-source może znaleźć środek zaradczy przeciwko urojeniom.
Uruchomiony przez HyperWrite, startup kierowany przez współzałożyciela i CEO Matta Shumera, Reflection 70B opiera się na Meta’s Llama 3.1-70B Instruct. To, co odróżnia ten model od innych, to jego zdolność do samokorygowania, wyjątkowa zdolność, która przykuła uwagę społeczności AI.
Z przyjemnością przedstawiam Reflection 70B, wiodący na świecie model open source.
Przeszli szkolenie z wykorzystaniem techniki Reflection-Tuning, która pozwala absolwentom LLM samodzielnie naprawiać swoje błędy.
Model 405B pojawi się w przyszłym tygodniu – spodziewamy się, że będzie to najlepszy model na świecie.
Zbudowany z @GlaiveAI.
Czytaj dalej : fot.twitter.com/kZPW1plJuo
— Matt Shumer (@mattshumer_) 5 września 2024 r.
Cechą wyróżniającą modelu Reflection 70B jest
Szumer ogłosił przybycie Reflection 70B na X i podkreślił jego wyższość nad innymi modelami na rynku open-source. Z przekonaniem stwierdził, że AI jest obecnie najlepszym modelem open-source AI, przewyższającym swoich poprzedników, w tym serię Llama firmy Meta. Benchmarki takie jak MMLU I Ocena człowieka potwierdziło również wysoką wydajność Reflection 70B, wykazując lepsze wyniki niż alternatywy open source i komercyjne.
Powodem, dla którego Reflection 70B osiąga takie wyniki, a także cechą, której brakuje jego konkurentom, jest jego zdolność wykrywania i korygowania błędów. Jest to przełomowa funkcja w AI, ponieważ podczas gdy modele językowe często „mieć halucynacje„lub produkują fałszywe informacje, sztuczna inteligencja Shumera potrafi rozpoznawać błędy przed udzieleniem ostatecznej odpowiedzi. Shumer myślał o tej koncepcji od miesięcy, a dzięki temu nowemu modelowi stała się ona rzeczywistością.
Reflection 70B może się równać nawet z najlepszymi modelami o zamkniętym kodzie źródłowym (Claude 3.5 Sonnet, GPT-4o).
To najlepszy program LLM (przynajmniej) z zakresu MMLU, MATH, IFEval, GSM8K.
Pokonuje GPT-4o we wszystkich testach.
Bije Lamę 3.1 405B. Nawet się do niej nie zbliża. fot.twitter.com/win7cHUOob
— Matt Shumer (@mattshumer_) 5 września 2024 r.
Nazwa Reflection 70B odzwierciedla jego możliwości introspekcji, ponieważ „odzwierciedla„jego rozumowanie w celu sprawdzenia dokładności modelu. Projekt obejmuje specjalne ikony, które usprawniają rozumowanie i korektę błędów, umożliwiając użytkownikom skuteczniejszą interakcję z modelem. Te procesy rozumowania można zobaczyć w formie specjalnych etykiet, które umożliwiają korekty w czasie rzeczywistym.
Aby wykazać jego skuteczność, użytkownicy mogą wchodzić w interakcję z Reflection 70B na strona demonstracyjnaale występują trudności w dostępie do witryny ze względu na duży ruch. Niektóre zadania, takie jak określanie, która liczba jest większa spośród 9.11 i 9.9są zaprojektowane tak, aby podważyć precyzję modelu. Podczas gdy wiele systemów AI ma problemy z takimi zapytaniami, Reflection 70B udało się je rozwiązać poprawnie, pomimo ponad 60 sekund. Pomimo opóźnienia, ten poziom rozumowania sprawia, że model wyróżnia się w przypadkach użycia, w których precyzja ma kluczowe znaczenie.
Refleksja 70B to dopiero początek
Reflection 70B to pierwszy model z rozwijającej się serii. Jeszcze większy model, Reflection 405B, zostanie wkrótce wydany. Ambitna wizja Shumera dla modeli Reflection obejmuje przewyższenie możliwości modeli o zamkniętym kodzie źródłowym, takich jak GPT-4 firmy OpenAI. Reflection 405B ma podobno przewyższyć najlepsze zastrzeżone modele i przesuwać granice tego, co może osiągnąć sztuczna inteligencja oparta na oprogramowaniu typu open source.
Ale Reflection 70B to nie tylko samodzielny projekt. Shumer ogłosił również plany zintegrowania modelu z Hiperzapisplatforma asystenta pisania. HyperWrite, rozszerzenie Chrome, które pomaga użytkownikom tworzyć e-maile, podsumowywać tekst i nie tylko, ma już miliony użytkowników. Nadchodząca integracja Reflection 70B z tą platformą zapewni użytkownikom nowy poziom dokładności i personalizacji, umożliwiając jeszcze bardziej zaawansowane pisanie z wykorzystaniem sztucznej inteligencji.
Szybki i efektywny proces szkoleniowy
Szkolenie Reflection 70B nie było długim, przewlekłym procesem dzięki współpracy z Glewiastartup specjalizujący się w zestawach danych AI. Platforma Glaive tworzy zestawy danych specyficzne dla przypadków użycia, dzięki czemu trenowanie modeli językowych jest łatwiejsze i szybsze. W przypadku Reflection 70B podejście to doprowadziło do trenowania modelu pięć razy w ciągu zaledwie trzech tygodni, co było możliwe dzięki wykorzystaniu syntetycznych systemów generowania danych Glaive.
Chcę być bardzo jasny — @GlaiveAI jest powodem, dla którego to zadziałało tak dobrze.
Kontrola jaką dają Ci w zakresie generowania syntetycznych danych jest niesamowita.
Będę ich używać przy niemal każdym modelu, jaki zbuduję w przyszłości i Ty również powinieneś. https://t.co/I789UIa5Yg
— Matt Shumer (@mattshumer_) 5 września 2024 r.
Założona przez Sahil Chaudhary firma ma na celu dostarczanie wysokiej jakości zestawów danych, które mogą trenować modele szybko i ekonomicznie. Ich sukces w trenowaniu mniejszych modeli został udowodniony w przeszłości. Model parametryzowany 3D przewyższył wielu dużych konkurentów open-source w niektórych zadaniach.
Odbicie 70B w akcji
Rozwój modelu pokazuje, jak ważne jest to dla HyperWrite, które zostało założone w 2020 r. jako Otherside AI. Początkowo z siedzibą w Long Island w Nowym Jorku HyperWrite rozwinęło się z małego asystenta pisania AI w platformę z ponad dwa miliony użytkowników. Jej wczesny sukces przyniósł Shumerowi i współzałożycielowi Jason Kuperberg plama na Lista „30 Under 30” magazynu Forbes w 2023 r..
W marcu 2023 r. HyperWrite pozyskał 2,8 miliona dolarów w finansowaniu od inwestorów takich jak Grupa Madrona Ventureco pomogło firmie się rozwijać. Nowe funkcje, takie jak asystenci przeglądarek, którzy mogą wykonywać zadania takie jak rezerwowanie lotów lub wyszukiwanie kandydatów do pracy na LinkedIn, sprawiły, że HyperWrite jest na czele osobistej pomocy opartej na sztucznej inteligencji. integracja Oczekuje się, że Reflection 70B rozszerzy te funkcje i jeszcze bardziej umocni pozycję HyperWrite w branży sztucznej inteligencji.
Reflection 70B zmieni sposób, w jaki myślimy o AI. Łączy precyzję i rozumowanie, jak żaden inny model. Model ten jest przydatny do zadań wymagających wysokiej dokładności, ale jego potencjalne zastosowania są znacznie szersze. Nadchodząca wersja Reflection 405B pokazuje, że Shumer i jego zespół nadal ciężko pracują. W miarę jak HyperWrite udoskonala swoją platformę i tworzy nowe funkcje, seria Reflection prawdopodobnie będzie bardzo ważna. W przypadku Reflection 70B będzie ciekawie zobaczyć, jak społeczność AI i użytkownicy zareagują na unikalne możliwości modelu i jak przyszłe modele będą budować na jego fundamencie.
Źródło wyróżnionego obrazu: DC Studio / Freepik
Source: Reflection 70B to sztuczna inteligencja, która potrafi korygować własne błędy