Google szczegółowo opisał swoje podejście do bezpieczeństwa funkcji agentowych przeglądarki Chrome, które umożliwiają zautomatyzowane działania, takie jak rezerwacja biletów lub zakupy, eliminując potencjalne ryzyko związane z danymi i finansami. Google stosuje kilka modeli zarządzania działaniami agentowymi. Krytyk dostosowania użytkownika, zbudowany za pomocą Gemini, analizuje elementy działań generowane przez model planisty. Jeśli model krytyka ustali, że zaplanowane zadania nie są zgodne z celami użytkownika, skłania planistę do ponownej oceny strategii. Model krytyka uzyskuje dostęp jedynie do metadanych proponowanych działań, a nie do rzeczywistej zawartości sieci. Aby ograniczyć dostęp agentów do niedozwolonych lub niezaufanych witryn, Google korzysta z zestawów pochodzenia agentów. Zestawy te ograniczają model do określonych źródeł tylko do odczytu i do odczytu i zapisu. Początki tylko do odczytu definiują zawartość, którą Gemini może konsumować; na przykład informacje o produktach w witrynie zakupów są trafne, ale reklamy banerowe nie. Agent może wchodzić w interakcję tylko z wyznaczonymi ramkami iframe na stronie. W poście na blogu firma stwierdziła: „To rozgraniczenie wymusza, aby agent miał dostęp tylko do danych z ograniczonego zestawu źródeł i dane te można przekazać wyłącznie do zapisywalnych źródeł. Ogranicza to wektor zagrożenia wyciekami danych z różnych źródeł. Daje to również przeglądarce możliwość wymuszenia części tego oddzielenia, na przykład poprzez nie wysyłanie do modelu danych spoza czytelnego zestawu. Google monitoruje nawigację na stronie za pomocą innego modelu obserwatora, aby zapobiec dostępowi do szkodliwych adresów URL generowanych przez model. W przypadku poufnych zadań Google wymaga zgody użytkownika. Jeśli agent próbuje uzyskać dostęp do wrażliwych witryn, takich jak platformy bankowe lub medyczne, prosi użytkownika o pozwolenie. Jeśli witryna wymaga logowania, Chrome poprosi użytkownika o pozwolenie na korzystanie z menedżera haseł; model agenta nie ma dostępu do danych dotyczących haseł. Użytkownicy zostaną zapytani, zanim agent zainicjuje działania takie jak dokonanie zakupu lub wysłanie wiadomości. Google wykorzystuje również klasyfikator szybkiego wstrzykiwania, aby zapobiegać niepożądanym działaniom, i ocenia możliwości agenta pod kątem ataków opracowanych przez badaczy. Na początku tego miesiąca Zakłopotanie udostępnił model wykrywania treści typu open source, aby przeciwdziałać atakom polegającym na natychmiastowym wstrzykiwaniu na agentów.
Source: Google korzysta z Gemini "krytyk" model do monitorowania agentów Chrome




