Możesz ulepszyć GPT-4 za pomocą OpenAI Evals

Poznaj ewaluatorów OpenAI. Wraz z wydaniem GPT-4 firma OpenAI wydała również platformę oprogramowania typu open source do testowania skuteczności swoich modeli sztucznej inteligencji.

Zespół OpenAI ogłosił nowy zestaw narzędzi, które nazywają Evalami, które umożliwią każdemu zgłaszanie problemów z modelami firmy i wprowadzanie zmian.

Co to są ewaluacje OpenAI?

W post na bloguOpenAI opisuje tę metodologię jako „podejście crowdsourcingowe” do walidacji modeli.

„Używamy Evali do kierowania rozwojem naszych modeli (zarówno do identyfikowania niedociągnięć, jak i zapobiegania regresji), a nasi użytkownicy mogą stosować je do śledzenia wydajności różnych wersji modeli i ewoluujących integracji produktów” — pisze OpenAI. „Mamy nadzieję, że Evalls stanie się narzędziem do udostępniania i pozyskiwania testów porównawczych, reprezentujących maksymalnie szeroki zestaw trybów awarii i trudnych zadań”.

-Otwórz AI

Celem projektu OpenAI Evans jest skonstruowanie i wykonanie testów porównawczych, które można wykorzystać do oceny skuteczności modeli takich jak GPT-4 poprzez dokładną analizę ich wydajności. Dzięki Evals programiści mogą generować pytania przy użyciu zestawów danych, oceniać dokładność odpowiedzi modelu OpenAI oraz oceniać skuteczność różnych zestawów danych i modeli.

  Czy to prawda, że ​​czarna tapeta oszczędza baterię?

Możesz ulepszyć GPT-4 za pomocą OpenAI EvalsEvalls jest nie tylko wstecznie kompatybilny z kilkoma dobrze znanymi testami porównawczymi AI, ale także umożliwia tworzenie nowych klas w celu korzystania z własnej logiki oceny. Aby służyć jako punkt odniesienia, OpenAI zaprojektowało ocenę zagadek logicznych z 10 przykładami problemów, z którymi zmaga się GPT-4.

To wszystko praca wolontariacka, co jest wielkim kłopotem. Niemniej jednak OpenAI zamierza zapewnić dostęp do GPT-4 osobom, które zapewniają „wysokiej jakości” testy porównawcze, aby zachęcić do korzystania z Evals.

„Wierzymy, że ewaluacje będą integralną częścią procesu korzystania z naszych modeli i budowania na ich podstawie, dlatego z zadowoleniem przyjmujemy bezpośrednie wkłady, pytania i opinie”.

-Otwórz AI

OpenAI, które ogłosiło, że przestanie domyślnie wykorzystywać dane konsumentów do szkolenia swoich modeli, dołącza do grona tych, którzy zwrócili się do crowdsource w celu wzmocnienia modeli AI za pomocą Evali.

Lubisz GPT-4? Sprawdź te:

  • Porównanie podpowiedzi ChatGPT
  • GPT-4 kontra ChatGPT
  Poprawka: rozwiązanie błędu Valorant TPM 2.0

Source: Możesz ulepszyć GPT-4 za pomocą OpenAI Evals