W 1998 r. Google uruchomił wyszukiwarkę, początkowo nazwany Backrub, działając na serwerze kampusu Stanford z 40 GB danych i umieszczono w przypadku bloków duplo. Od 2025 r. Możliwości wyszukiwania Google wymagają wielu centrów danych. Ryan Pearce stworzył wyszukiwarkę DIY o nazwie Searcha Page, w tym wersja skoncentrowana na prywatności o nazwie Seek Ninja, z serwerem znajdującym się w jego pralni obok pralki i suszarki. Pearce stwierdza: „W tej chwili, w pralni, mam więcej pamięci niż Google w 2000 roku. I to po prostu szalone do myślenia”. Serwer był początkowo w sypialni Pearce, ale został przeniesiony do pomieszczenia narzędziowym z powodu nadmiernego ciepła. „Ciepło nie było absolutnie okropne, ale jeśli drzwi są zbyt długo zamknięte, jest to problem” – mówi. Wyniki strony Searcha ulegają poprawie, a jego baza danych zawiera 2 miliardy wpisów, oczekuje się, że osiągnie 4 miliardy w ciągu sześciu miesięcy. Dla porównania, Google miał 24 miliony stron w 1998 r. I 400 miliardów do 2020 r., Jak ujawniono podczas badania antymonopolowego w USA przeciwko Google LLC. Silnik Pearce wykorzystuje duże modele językowe do rozszerzenia słów kluczowych i zrozumienia kontekstu. „To, co robię, to naprawdę bardzo tradycyjne wyszukiwanie” – mówi Pearce. „To właśnie zrobił Google 20 lat temu, z wyjątkiem jedynej poprawki jest to, że używam AI do rozszerzenia słów kluczowych i pomocy w zrozumieniu kontekstu, co jest trudne”. AI była kluczową częścią wyszukiwarek, w tym narzędzi, takich jak odwrotne wyszukiwanie obrazów, RankBrain Google i 90% ML Bing w 2019 roku. AI jest teraz postrzegane jako sposób na efektywne budowanie i skalowanie wyszukiwarek. Pearce wykorzystuje „Uaktualnij arbitraż”, kupując stary, ale potężny sprzęt serwerowy. Jego 32-rdzeniowy procesor AMD EPYC 7532, który kosztuje ponad 3000 USD w 2020 r., Obecnie kosztuje mniej niż 200 USD w serwisie eBay. „Mógłbym uzyskać kolejny układ za tę samą cenę, która miałaby dwa razy więcej nici, ale spowodowałoby to zbyt dużo ciepła” – mówi. Cały system kosztował 5000 USD, a 3000 USD wydano na przechowywanie. Baza kodowa Pearce wynosi około 150 000 linii kodu, a około 500 000 wierszy iteracyjnych prac. Poszukiwanie strony i poszukaj Ninja Użyj Sambanova, aby uzyskać szybki dostęp do modelu LAMA 3 przy niskim koszcie. Annie Shea Weckesser, CMO Sambanova, zauważa, że dostęp do modeli tanich staje się coraz niezbędny dla programistów solo, takich jak Pearce, dodając, że firma „daje programistom narzędzia do szybkiego i przystępowania modeli AI, niezależnie od tego, czy pracują z konfiguracji domu lub działają w produkcji”. Pearce używa wspólnego repozytorium indeksowania do budowy swojego boksu. „Naprawdę je doceniam. Chciałbym móc coś oddać, ale może kiedy jestem większy” – mówi. Początkowa próba użycia bazy danych wektorowych nie powiodła się, co spowodowało „bardzo artystyczne” wyniki. Pearce wykorzystuje teraz podsumowania stron generowanych przez LLM. Wilson Lin, kolejny programista wyszukiwarki DIY, korzysta z samodzielnego narzędzia wyszukiwania wektorowego o nazwie Corenn i opiera się na dziewięciu osobnych usługach w chmurze, aby utrzymać niskie koszty. „To o wiele tańsze niż [Amazon Web Services]- Znaczna kwota – mówi Lin. „I daje mi wystarczającą zdolność, aby dostać się gdzieś z tym projektem w rozsądnym budżecie”. Pearce pierwotnie wyobrażała sobie małą wyszukiwarkę podobną do Margininia, faworyzując małe strony nad dużą technologią. . . Myślę, że chciał nieocenzurowanej wyszukiwarki, którą chciał nakarmić za pomocą swojego LLM, podobnie jak wyszukiwanie swojego agenta, „mówi. Rozszerzenie się poza angielski wymagałoby nowych zestawów danych. Pearce planuje przenieść wyszukiwarkę do obiektu kolokacji, gdy ruch osiągnie określony próg i generuje skromne przychody poprzez reklamę w stylu partnerskim.„ Mój plan jest, gdybym przejść przez określoną kwotę ruchu. pralnia na zawsze. ” Termin składania wniosków dla najbardziej innowacyjnych nagród firmy Fast Company to piątek, 3 października o 23:59 Pt.
Source: Strona wyszukiwania w wyszukiwarkach DIY rywale wczesna pamięć Google
