TechBriefly PL
  • Tech
  • Business
  • Geek
  • Science
  • How to
  • about
    • Sur Tech Briefly
    • Modalités et Conditions
    • Politique de Confidentialité
    • Contact Us
No Result
View All Result
TechBriefly PL
No Result
View All Result
Home Tech
Anthropic chce sfinansować nową i bardziej wszechstronną generację testów porównawczych AI

Anthropic chce sfinansować nową i bardziej wszechstronną generację testów porównawczych AI

byBarış Selman
02/07/2024
in Tech
Reading Time: 4 mins read
Share on FacebookShare on Twitter

Anthropic uruchamia nowy program mający na celu sfinansowanie opracowania nowych testów porównawczych służących do oceny wydajności i wpływu modeli sztucznej inteligencji, w tym modeli generatywnych, takich jak Claude.

Najnowszy ruch firmy zmieni sposób oceny modeli sztucznej inteligencji, mając na celu stworzenie punktów odniesienia, które dokładnie odzwierciedlają rzeczywiste zastosowania i zapewniają bezpieczeństwo sztucznej inteligencji.

Historyczny przegląd testów porównawczych AI

Testy porównawcze AI odgrywają ważną rolę w ocenie wydajności modelu. Tradycyjnie mierzą zadania takie jak rozpoznawanie obrazów i przetwarzanie języka naturalnego. Jednak bardziej kompleksowe i realistyczne testy porównawcze są potrzebne w przypadku bardziej zaawansowanych systemów, takich jak modele generatywne. Tradycyjne testy porównawcze nie oddają złożoności rzeczywistych aplikacji i nie odzwierciedlają wyzwań współczesnych technologii AI.

Anthropic chce sfinansować nową i bardziej wszechstronną generację testów porównawczych AI
W zakresie bezpieczeństwa sztucznej inteligencji firma Anthropic skupia się na opracowywaniu metryk pozwalających ocenić potencjalne zagrożenia bezpieczeństwa, takie jak cyberataki (Źródło obrazu)

Dlaczego Anthropic podjął taką inicjatywę?

Anthropic ma na celu rozwiązanie niedociągnięć istniejących benchmarków poprzez finansowanie nowych i kompleksowych metod oceny. Skupiając się na bezpieczeństwie AI i wpływie na społeczeństwo, firma chce opracować kryteria mierzące zaawansowane możliwości. Program ma na celu stworzenie wystarczająco trudnych benchmarków, realistycznych i istotnych dla bezpieczeństwa.

  Jak naprawić błąd NBA2K o kodzie 4b538e50?

Program będzie koncentrował się na trzech głównych obszarach: ocenach bezpieczeństwa AI, zaawansowanych możliwościach i punktach odniesienia bezpieczeństwa oraz infrastrukturze, narzędziach i metodach oceny. Zajmując się tymi obszarami, Anthropic ma na celu stworzenie skalowalnych i gotowych do użycia punktów odniesienia.

Kluczowe obszary zainteresowania programu

Jednym z głównych obszarów zainteresowania są oceny bezpieczeństwa AI. Oceny te mierzą zadania o istotnych implikacjach bezpieczeństwa, takie jak przeprowadzanie cyberataków. Innym obszarem zainteresowania są zaawansowane testy porównawcze możliwości i bezpieczeństwa, które mierzą wydajność w przypadku złożonych zadań wymagających wysokiego poziomu wiedzy specjalistycznej. Trzecim obszarem jest rozwój infrastruktury, narzędzi i metod tworzenia ocen.

Zasady skutecznej oceny

Skuteczne oceny powinny być rygorystyczne i znaczące. Oceny powinny być wystarczająco trudne i nie powinny być uwzględniane w danych szkoleniowych modelu AI. Wydajność i skalowalność to ważne zasady. Oceny powinny być opracowywane przy udziale ekspertów w danej dziedzinie. Dobra dokumentacja i powtarzalność są niezbędne dla przejrzystości i replikacji.

  Implant mózgu przywraca niemal instant mowę dla sparaliżowanego mężczyzny
Anthropic chce sfinansować nową i bardziej wszechstronną generację testów porównawczych AI
Inicjatywa ta ma na celu rozwiązanie ograniczeń istniejących wskaźników sztucznej inteligencji, które często nie odzwierciedlają złożoności rzeczywistego świata (Źródło obrazu)

Proces składania wniosków i rozpatrywania wniosków

Anthropic ustanowił ustrukturyzowany proces składania i przeglądania wniosków w ramach nowych kryteriów. Zainteresowane organizacje mogą składać swoje wnioski poprzez formularz zgłoszeniowyFirma zapewnia wsparcie finansowe i oferuje opcje finansowania dostosowane do potrzeb projektu.

Wybrane propozycje będą miały okazję współpracować z ekspertami domenowymi Anthropic. Współpraca zapewni, że oceny będą opracowywane zgodnie z wysokimi standardami i będą dotyczyć najpilniejszych wyzwań w zakresie bezpieczeństwa i wydajności AI.

Inicjatywa Anthropic mająca na celu sfinansowanie następnej generacji benchmarków AI ma na celu ulepszenie oceny modeli AI. Poprzez zajęcie się ograniczeniami istniejących benchmarków program ma na celu stworzenie bardziej kompleksowych i znaczących ocen. Poprzez współpracę z organizacjami zewnętrznymi i wsparcie ekspertów dziedzinowych, Anthropic ma nadzieję podnieść poziom bezpieczeństwa AI i dodać cenne narzędzia do ekosystemu AI.

Źródło wyróżnionego obrazu: vecstock / Freepik

Source: Anthropic chce sfinansować nową i bardziej wszechstronną generację testów porównawczych AI

Related Posts

Jak usunąć wirusa za pomocą wiersza poleceń

Jak usunąć wirusa za pomocą wiersza poleceń

Jak uruchomić komputer w wierszu poleceń w celu rozwiązania problemu

Jak uruchomić komputer w wierszu poleceń w celu rozwiązania problemu

Uruchamianie plików Pythona i naprawianie błędów ścieżki w systemie Windows

Uruchamianie plików Pythona i naprawianie błędów ścieżki w systemie Windows

Jak instalować mody i niestandardową zawartość w The Sims 2

Jak instalować mody i niestandardową zawartość w The Sims 2

Jak usunąć wirusa za pomocą wiersza poleceń
Tech

Jak usunąć wirusa za pomocą wiersza poleceń

Jak uruchomić komputer w wierszu poleceń w celu rozwiązania problemu
Tech

Jak uruchomić komputer w wierszu poleceń w celu rozwiązania problemu

Uruchamianie plików Pythona i naprawianie błędów ścieżki w systemie Windows
Tech

Uruchamianie plików Pythona i naprawianie błędów ścieżki w systemie Windows

Jak instalować mody i niestandardową zawartość w The Sims 2
Tech

Jak instalować mody i niestandardową zawartość w The Sims 2

OpenAI uruchamia Skills in Codex
Tech

OpenAI uruchamia Skills in Codex

TechBriefly PL

© 2021 TechBriefly is a Linkmedya brand.

  • About
  • Blog
  • Contact
  • Contact Us
  • Cover Page
  • Modalités et Conditions
  • Politique de Confidentialité
  • Sur Tech Briefly
  • TechBriefly

Follow Us

No Result
View All Result
  • Tech
  • Business
  • Geek
  • Science
  • How to
  • about
    • Sur Tech Briefly
    • Modalités et Conditions
    • Politique de Confidentialité
    • Contact Us

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.