Google AI wydało EmbeddingGemma, nowy model osadzania na urządzeniu, który ma 308 milionów parametrów. Według Google jego kompaktowy rozmiar pozwala skutecznie funkcjonować na urządzeniach mobilnych i ustawieniach offline. Model osiąga opóźnienie wnioskowania Sub-15MS dla 256 tokenów na Edgetpu, co czyni go odpowiednim do aplikacji w czasie rzeczywistym. Szkolony w zakresie danych obejmujących ponad 100 języków, EmbeddingGemma zabezpieczył najwyższą pozycję w masowym poziomie wskaźnikowym osadzania tekstu (MTEB) wśród modeli z mniej niż 500 milionów parametrów. Google zgłasza rywale wydajności lub przewyższa modele osadzania prawie dwa razy większe, szczególnie w zakresie wykładania między linie i wyszukiwaniem semantycznym. Więcej informacji jest dostępnych za pośrednictwem podanych linków do pełnej analizy, modelu przytulania twarzy i szczegółów technicznych.
Source: Google AI uwalnia model na urządzeniu EmbeddingGemma





