Wydajne aplikacje do wyszukiwania wektorów można łatwo tworzyć przy użyciu bazy danych wektorów Pinecone, ale wielu użytkowników zastanawia się, jak uzyskać interfejs API Pinecone. Baza danych jest atrakcyjna programiścicałkowicie kontrolowanei łatwo rozszerzalne bez problemów z infrastrukturą.
Tworzenie wysokowydajnych aplikacji do wyszukiwania wektorowego jest proste dzięki Szyszka. Jest to zarządzana, wolna od infrastruktury wektorowa baza danych, która została stworzona dla chmury.
W tym artykule wyjaśnimy, jak uzyskać Pinecone API, które jest kluczową informacją zacząć używać Platforma. Dlatego bez zbędnych ceregieli przejdźmy do szczegółów.
Jak uzyskać API Pinecone?
Poniżej możesz zobaczyć nasz przewodnik krok po kroku, jak dowiedzieć się, jak uzyskać Pinecone API i jak zacząć korzystać z platformy w ciągu zaledwie kilku minut. Proces jest właściwie dość prosty ale może powodować pewne zamieszanie dla nowych użytkowników. Postępuj zgodnie z poniższymi instrukcjami, a zaczniesz w mgnieniu oka!
Zainstaluj klienta Pinecone
Ten krok jest właściwie nie wymagane. Usuń tę akcję tylko wtedy, gdy chcesz użyć opcji Klient Pythona. Jednak zalecamy to zrobić, ponieważ upraszcza to proces na dłuższą metę.
Aby zainstalować Pinecone, użyj polecenia powłoki:
pip zainstaluj klienta pinecone
Uzyskaj klucz Pinecone API i zweryfikuj go
potrzebujesz Klucz API wykorzystać Pinecone. Jako główny krok naszego przewodnika, jak uzyskać Pinecone API, otwórz konsolę Pinecone i wybierz Klucze API, aby zlokalizować swój klucz API. Dodatkowo w tym widoku jest pokazane środowisko dla Twojego projektu. Zwróć uwagę na swoje środowisko a także klucz API.
Użyj tych poleceń, aby sprawdzić, czy klucz API Pinecone działa:
importować szyszkę
pinecone.init(api_key=”TWÓJ_KLUCZ_API”, środowisko=”TWOJE_ŚRODOWISKO”)
Twój klucz API to prawowity jeśli nie pojawi się komunikat o błędzie.
Reszta jest trochę skomplikowana
Pozostałe kroki możesz zakończyć na jeden z trzech sposobów:
- Twórz i uruchamiaj kod Pythona w swojej przeglądarce, korzystając z „Cześć, Szyszko!” notatnik colab.
- Skopiuj następujące polecenia języka Python do lokalnej instalacji języka Python.
- Użyj następujących poleceń API cURL.
Inicjowanie szyszki
importować szyszkę
pinecone.init(api_key=”TWÓJ_KLUCZ_API”, środowisko=”TWOJE_ŚRODOWISKO”)
Tworzenie indeksu
Kolejne polecenia ustanawiają indeks o nazwie „szybki start”, który przeprowadza zgrubne wyszukiwanie najbliższego sąsiada dla 8-wymiarowych wektorów przy użyciu euklidesowej metryki odległości.
Utworzenie indeksu zajmuje około minuty.
pinecone.create_index(“szybki start”, wymiar=8, metric=”euclidean”, pod_type=”p1″)
Indeksy opracowane przez określone projekty open source, takie jak AutoGPT, są archiwizowane i usuwane po 1 dniu braku aktywności w planie Starter (darmowym). Ogólnie rzecz biorąc, indeksy wykonane przez inne plany są archiwizowane i później usuwane 7 dni bezczynności. Wysłanie dowolnego wywołania API do Pinecone spowoduje zresetowanie licznika, co zapobiegnie temu.
Pobieranie listy twoich indeksów
Nazwa twojego indeksu pojawia się w pliku lista indeksów gdy już została założona.
Poniższe polecenia zwrócą listę twoich indeksów.
szyszka.list_indexes()
# Zwroty:
# [‘quickstart’]
Łączenie z indeksem (tylko klient)
Musisz połączyć się z indeksem przed użyciem klienta do zapytania.
Polecenia wymienione poniżej mogą być używane do łączenia się z indeksem.
indeks = szyszka.Indeks(“szybki start”)
Wstawianie danych
Użyj wstawić operacja wstawiania wektorów do pliku index.
Akcja upsert dodaje nowy wektor do indeksu lub, jeśli istnieje już istniejący wektor o tym samym identyfikatorze, aktualizuje wektor.
Polecenia wymienione poniżej wstawiają pięć ośmiowymiarowych wektorów do indeksu.
# Upsert przykładowych danych (5 8-wymiarowych wektorów)
indeks.upsert([
(“A”, [0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1]),
(“B”, [0.2, 0.2, 0.2, 0.2, 0.2, 0.2, 0.2, 0.2]),
(“C”, [0.3, 0.3, 0.3, 0.3, 0.3, 0.3, 0.3, 0.3]),
(“D”, [0.4, 0.4, 0.4, 0.4, 0.4, 0.4, 0.4, 0.4]),
(“MI”, [0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5])
])
Punkt końcowy twojego indeksu Pinecone jest używany przez powyższy kod cURL.
Pamiętaj, że przesyłaj dane w partiach 100 wektorów lub mniej w ciągu kilku żądań upsert w przypadku upsertowania większych ilości danych.
Pobieranie statystyk dotyczących Twojego indeksu
Poniższe polecenia zapewniają Statystyka o zawartości Twojego indeksu.
index.describe_index_stats()
# Zwroty:
# {‘wymiar’: 8, ‘index_fullness’: 0.0, ‘namespaces’: {”: {‘vector_count’: 5}}}
Zapytanie o indeks i uzyskanie podobnych wektorów
Poniższy przykład wykorzystuje metrykę odległości euklidesowej zdefiniowaną w kroku 2 („Tworzenie indeksu”) powyżej, aby wyszukać w indeksie trzy wektory, które są najbardziej podobne do przykładu 8-wymiarowy wektor.
indeks.zapytanie(
wektor=[0.3, 0.3, 0.3, 0.3, 0.3, 0.3, 0.3, 0.3],
top_k=3,
include_values=Prawda
)
# Zwroty:
# {‘mecze’: [{‘id’: ‘C’,
# ‘score’: 0.0,
# ‘values’: [0.3, 0.3, 0.3, 0.3, 0.3, 0.3, 0.3, 0.3]},
# {‘identyfikator’: ‘D’,
# „wynik”: 0,0799999237,
# „wartości”: [0.4, 0.4, 0.4, 0.4, 0.4, 0.4, 0.4, 0.4]},
# {‘identyfikator’: ‘B’,
# „wynik”: 0,0800000429,
# „wartości”: [0.2, 0.2, 0.2, 0.2, 0.2, 0.2, 0.2, 0.2]}],
# ‘przestrzeń nazw’: ”}
Usuwanie indeksu
Użyj usuń_indeks operację usunięcia indeksu po zakończeniu korzystania z niego.
Indeks jest usuwany za pomocą poniższych poleceń.
pinecone.delete_index(“szybki start”)
Należy pamiętać, że indeks, który został usunięty Nie mogę zostać ponownie użyty.
Po wykonaniu wszystkich tych kroków powinieneś już wiedzieć, jak uzyskać Pinecone API i zacząć korzystać z Pinecone. Jeśli jesteś zainteresowany, możesz również sprawdzić: Co to jest AutoGPT i jak z niego korzystać?