Reddit dokonał w tym tygodniu dużej zmiany, aby chronić swoje treści przed zabraniem bez pozwolenia. Zaktualizowali coś, co nazywa się plikiem robots.txt, który informuje programy komputerowe (takie jak te używane przez wyszukiwarki), czy mogą przeglądać witrynę internetową. Ten plik jest ważny, ponieważ pozwala wyszukiwarkom wyświetlać strony internetowe, gdy czegoś szukasz.
Jednak teraz, wraz z rozwojem sztucznej inteligencji, niektóre firmy pobierają treści ze stron internetowych takich jak Reddit w celu szkolenia swoich systemów sztucznej inteligencji, nie pytając ani nie podając informacji o oryginalnych twórcach. Stało się to poważnym problemem, ponieważ nie szanuje ludzi, którzy stworzyli treść, ani witryn, które ją hostują.
Co robi Reddit?
Aktualizacja Reddita do pliku robots.txt ma na celu kontrolowanie sposobu wykorzystania jego zawartości. Zamierzają także ograniczyć i zablokować dostęp do ich witryny nieznanym programom komputerowym i botom, jeśli nie będą przestrzegać zasad Reddita lub nie będą miały pozwolenia na korzystanie z treści.
Reddit twierdzi, że te zmiany nie wpłyną na większość ludzi ani dobre organizacje, takie jak badacze lub grupy, które zapisują historię Internetu (jak Internet Archive). Zamiast tego próbują powstrzymać firmy AI przed korzystaniem z treści Reddita bez pozwolenia. Jednak te programy AI nadal mogą ignorować zasady Reddita.
Ostatnie dochodzenie i odpowiedzi
Oświadczenie to jest następstwem raportu Wired, z którego wynika, że oparta na sztucznej inteligencji firma Perplexity, zajmująca się wyszukiwaniem, pobierała treści ze stron internetowych, mimo że zakazano tego w pliku robots.txt. Dyrektor generalny Perplexity argumentował, że zasady te nie stanowią wymogów prawnych, co wywołało debatę na temat tego, w jaki sposób strony internetowe mogą chronić swoje treści.
Dane z Reddita na razie należą do Google
Nowe zasady Reddita nie będą miały wpływu na firmy, które mają już z nimi umowy. Na przykład Reddit ma umowę o wartości 60 milionów dolarów z Google, która pozwala Google na wykorzystywanie danych Reddita do swoich projektów AI. To pokazuje, że Reddit uważa, kto może korzystać z jego danych i chce mieć pewność, że są to zaufani partnerzy.
„Każdy, kto korzysta z treści Reddita, musi przestrzegać naszych zasad, aby chronić użytkowników Reddita” – stwierdził Reddit w oświadczeniu post na blogu. „Starannie wybieramy, z kim współpracujemy i powierzamy dostęp do treści Reddit”.
Patrząc w przyszłość
Ta zmiana wprowadzona przez Reddit jest częścią ich wysiłków mających na celu kontrolowanie sposobu wykorzystania ich danych, szczególnie przez firmy w celach komercyjnych. Pokazuje rosnącą tendencję wśród stron internetowych do ochrony ich treści w dobie sztucznej inteligencji i big data.
Ruch Reddita wysyła jasny komunikat: podczas gdy AI ma wielki potencjał, szacunek dla źródła danych i uzyskanie pozwolenia jest naprawdę ważne. Wraz ze zmianami w Internecie działania Reddita mogą wpłynąć na sposób, w jaki inne strony internetowe chronią swoje treści i prawa użytkowników.
Wszystkie obrazy są generowane przez Eray Eliaçık/Bing
Source: Reddit sprawi, że zapłacisz za swoje dane