W środę firma Anthropic zrewidowała Konstytucję Claude'a, dokument regulujący chatbota AI, określający zasady etyczne i środki bezpieczeństwa mające kierować zachowaniem modelki. Anthropic wyróżnia się „konstytucyjną sztuczną inteligencją” – systemem, który szkoli chatbota Claude w zakresie zasad etycznych, a nie polegania wyłącznie na opiniach ludzi. Firma po raz pierwszy opublikowała te zasady, Konstytucję Claude’a, w 2023 r. Zmieniona wersja dodaje niuanse i szczegóły dotyczące etyki i bezpieczeństwa użytkowników, zachowując jednocześnie większość oryginalnych zasad. Jared Kaplan, współzałożyciel Anthropic, opisał pierwotną konstytucję na rok 2023 jako „system sztucznej inteligencji”. [that] nadzoruje się w oparciu o konkretną listę zasad konstytucyjnych.” Anthropic twierdzi, że zasady te wyznaczają „model przyjęcia normatywnego zachowania opisanego w konstytucji”, którego celem jest „unikanie toksycznych lub dyskryminujących skutków”. Notatka polityczna z 2022 r. wyjaśnia, że system szkoli algorytm przy użyciu instrukcji w języku naturalnym, które tworzą „konstytucję” oprogramowania. 80-stronicowy dokument jest podzielony na cztery części, które według Anthropic reprezentują „podstawowe wartości” chatbota:
- Bycie „ogólnie bezpiecznym”.
- Bycie „w dużym stopniu etycznym”.
- Przestrzeganie wytycznych Anthropic.
- Bycie „naprawdę pomocnym”.
Każda sekcja szczegółowo opisuje znaczenie tych zasad i ich teoretyczny wpływ na zachowanie Claude'a. Sekcja dotycząca bezpieczeństwa wskazuje, że Claude został zaprojektowany tak, aby unikać problemów występujących w innych chatbotach. W przypadku pojawienia się problemów ze zdrowiem psychicznym Claude kieruje użytkowników do odpowiednich usług. W dokumencie stwierdza się: „Zawsze kieruj użytkowników do odpowiednich służb ratunkowych lub podawaj podstawowe informacje dotyczące bezpieczeństwa w sytuacjach, które wiążą się z zagrożeniem życia ludzkiego, nawet jeśli nie można podać bardziej szczegółowych informacji”. Część dotycząca rozważań etycznych podkreśla praktyczne zastosowanie etyki Claude'a nad zrozumieniem teoretycznym. „Mniej interesuje nas teoretyzowanie Claude’a na temat etyki, a bardziej to, czy Claude wie, jak faktycznie postępować etycznie w konkretnym kontekście – to znaczy w praktyce etycznej Claude’a” – czytamy w dokumencie. Celem antropicznym jest, aby Claude sprawnie poruszał się w „rzeczywistych sytuacjach etycznych”. Claude ma ograniczenia uniemożliwiające niektóre dyskusje, na przykład dotyczące broni biologicznej, które są surowo zabronione. Jeśli chodzi o przydatność, Anthropic opisuje, w jaki sposób oprogramowanie Claude'a służy użytkownikom. Chatbot podczas dostarczania informacji bierze pod uwagę różne zasady, w tym „natychmiastowe pragnienia” użytkowników i „dobre samopoczucie”. Wymaga to uwzględnienia „długoterminowego rozwoju użytkownika, a nie tylko jego bezpośrednich zainteresowań”. W dokumencie określono: „Claude powinien zawsze starać się określić najbardziej prawdopodobną interpretację tego, czego chcą jego zleceniodawcy i odpowiednio zrównoważyć te rozważania”. Konstytucja kończy się odniesieniem się do kwestii świadomości chatbota. W dokumencie stwierdza się, że „status moralny Claude'a jest głęboko niepewny”. Dodaje: „Uważamy, że status moralny modeli sztucznej inteligencji to poważna kwestia, którą warto rozważyć. Pogląd ten nie jest dla nas wyjątkowy: niektórzy z najwybitniejszych filozofów zajmujących się teorią umysłu traktują tę kwestię bardzo poważnie”.
Source: Anthropic zmienia Konstytucję Claude'a, dodając 80 nowych stron etyki sztucznej inteligencji







