Miqu 70b i Mistral 70b zostały wreszcie zaprezentowane, a niedawny wyciek Mistral Medium rzucił światło na długo oczekiwane modele AI typu open source i zaprezentowano ich możliwości.
W świecie sztucznej inteligencji wrzało od modelu „Miqu-1-70b” i jego potencjalnego połączenia z tajnym medium Mistral Medium firmy Mistral AI. 28 stycznia w tajemniczy sposób „Miqu Dev”. przesłał pliki „miqu-1-70b” na Hugging Facea następnie pojawienie się na 4chan i X.
Model zrobił wrażenie, w niektórych obszarach nawet rywalizując z GPT-4. Nie jesteś jeszcze przekonany? Widzieć Programy N8‘ post na X poniżej.
Czymkolwiek jest Miqu, ma jakiś specjalny sos. Uzyskał wynik 83,5 w EQ-Bench (ocena lokalna), przewyższając *każdy inny LLM na świecie z wyjątkiem GPT-4*. EQ-Bench ma korelację 0,97 z MMLU i 0,94 z Arena Elo. *Bije* Mistral Medium – w Q4_K_M. I… pic.twitter.com/0gOOPjxjPD
— Programy N8 (@Programy N8) 30 stycznia 2024 r
Wyciek Mistral Medium ujawnia Miqu 70b i Mistral 70b
28 stycznia użytkownik o imieniu „Miqu Dev” zamieścił bombę na HuggingFace, popularnej platformie dla entuzjastów sztucznej inteligencji. Przesłali zestaw plików składających się na model Miqu 70B, który wywołał spore zamieszanie w świecie sztucznej inteligencji. Model ten jest okrzyknięty potencjalnym rewolucyjnym rozwiązaniem, a niektórzy twierdzą, że mógłby dać GPT-4 szansę na wygraną.
Model został przetestowany w oparciu o cztery profesjonalne niemieckie egzaminy szkoleniowe z zakresu ochrony danych, które odzwierciedlały rzeczywiste testy certyfikacyjne wymagane od pracowników. Wyniki były imponujące, z Miqu 1 70B poprawnie odpowiadając na 17 z 18 pytań wielokrotnego wyboru, wykazując się solidnym zrozumieniem treści. Nie zastosował się jednak do instrukcji odpowiadania „OK” w celu potwierdzenia informacji, co świadczy o uchybieniu w stosowaniu się do instrukcji.
W porównaniu do innych modeli, Miqu 70B wykazał się biegłymi umiejętnościami językowymi i umiejętnościami dwujęzycznymi. Nie przewyższył jednak Model Mixtral-8x7B-Instruct-v0.1 lub inne wysokiej klasy modele, takie jak GPT-4, Goliat-120B-GGUFI Tess-XL-v1.0-GGUFz których wszystkie uzyskały doskonałe wyniki w obu rundach testowych i zastosowały się do instrukcji „OK”.
Czy Miqu 70B to naprawdę przeciek Mistral Medium?
Pochodzenie Miqu-1-70B pozostaje tajemnicą, a niektórzy spekulują, że jest to wersja Mistral-Medium, która wyciekła, lub starsza wersja eksperymentalna. Wydajność modelu wywołała debaty i dyskusje w społeczności technologicznej. Niektórzy twierdzą, że to prawdziwa okazja, inni zaś są sceptyczni.
Artur Mensch, wielki szef Mistral, w końcu odniósł się do plotek. Potwierdził, że chętny bóbr z wczesnego dostępu dał się ponieść emocjom i wypuścił stary model. Mensch zasugerował jednak również, że od tego czasu przygotowywali coś jeszcze lepszego – model, który potencjalnie mógłby przyćmić GPT-4.
Nadmiernie entuzjastyczny pracownik jednego z naszych klientów korzystających z usługi wczesnego dostępu ujawnił skwantyzowaną (i ze znakiem wodnym) wersję starego modelu, który przeszkoliliśmy i rozpowszechnialiśmy całkiem otwarcie.
Aby szybko rozpocząć współpracę z kilkoma wybranymi klientami, przekwalifikowaliśmy ten model z Lamy 2 w chwili, gdy tylko otrzymaliśmy…
— Arthur Mensch (@arthurmensch) 31 stycznia 2024 r
Jeśli Mistral wprowadzi model open source na równi z GPT-4, może to wywołać falę uderzeniową na scenie AI. Być może OpenAI będzie musiało uważać na swoje plecy, ponieważ w mieście pojawił się nowy rywal, gotowy rzucić wyzwanie status quo. Ten wyciek może równie dobrze być iskrą, która rozświetli zupełnie nową erę w sztucznej inteligencji, w której występują wielkie nazwiska
Czy zatem Mistral jest lepszy od ChatGPT?
Ustalenie, czy Mistral jest „lepszy” niż ChatGPT, jest trudne, ponieważ zależy od tego, czego szukasz w LLM i jak definiujesz „lepiej”. Oto zestawienie ich mocnych i słabych stron, które pomoże Ci zdecydować, który z nich będzie lepiej odpowiadał Twoim potrzebom:
Mistral
Silne strony:
- Otwarte źródło: Mistral oferuje kilka modeli, w tym niektóre modele typu open source, dzięki czemu są one bardziej dostępne do celów osobistych i badawczych
- Efektywność: Modele Mistral, takie jak Mixtral-8x7B, są znane ze swojej wydajności i wymagają mniejszej mocy obliczeniowej niż porównywalne modele, takie jak GPT-4
- Przezroczystość: Chociaż nie wszystkie modele są typu open source, Mistral jest zwykle bardziej przejrzysty w zakresie procesu rozwoju i badań w porównaniu z podejściem OpenAI opartym na zamkniętym kodzie źródłowym z ChatGPT
Słabości:
- Wydajność: Ogólnie rzecz biorąc, modele Mistral uzyskują nieco niższe wyniki niż najlepsze modele, takie jak GPT-4, w testach porównawczych takich zadań, jak generowanie i tłumaczenie tekstu
- Dostępność: Niektóre z najpotężniejszych modeli Mistral (np. Mistral Medium) nie są publicznie dostępne lub wymagają list oczekujących i opłat za dostęp
- Ograniczona społeczność: W porównaniu do ChatGPT, Mistral ma mniejszą bazę użytkowników i mniejszą społeczność, co może ograniczyć dostępne zasoby i wsparcie
CzatGPT
Silne strony:
- Wydajność: GPT-4 wykazuje obecnie najwyższą wydajność w wielu testach porównawczych, szczególnie w obszarach takich jak kreatywne generowanie tekstu i złożony dialog
- Dostępność: OpenAI oferuje bezpłatny dostęp do ChatGPT za pośrednictwem programów beta i interfejsów API, dzięki czemu jest łatwiej dostępny do użytku osobistego
- Duża społeczność: Duża baza użytkowników i społeczność tworzą obszerne zasoby, przewodniki i aplikacje do korzystania z ChatGPT
Słabości:
- Zamknięte źródło: Zamknięty charakter ChatGPT budzi obawy dotyczące przejrzystości i potencjalnych błędów w modelu
- Koszt obliczeniowy: GPT-4 wymaga znacznej mocy obliczeniowej, przez co jest mniej dostępny dla osób o ograniczonych zasobach
- Obawy etyczne: Kontrola OpenAI nad dostępem i ograniczona przejrzystość budzą obawy dotyczące odpowiedzialnego rozwoju i potencjalnego niewłaściwego wykorzystania technologii
Ostatecznie „lepsza” opcja zależy od Twoich priorytetów. Jeśli potrzebujesz modelu typu open source o dobrej wydajności i przejrzystości, Mistral może być dobrym rozwiązaniem. Jeśli priorytetowo traktujesz najwyższą wydajność i szersze wsparcie społeczności, ChatGPT może być lepszym wyborem.
Autor wyróżnionego obrazu: AI Mistrala.
Source: Mistral AI zrzuca bombę na społeczność AI