Według Autorytet Androidnajnowsza wersja beta aplikacji Gemini Android, w szczególności wersja 16.30.59.sa.arm64 aplikacji Google, wskazuje na nadchodzącą obsługę załączników plików audio na czatach. Użytkownicy mogą teraz obserwować opcję dołączania plików audio, takich jak MP3, do ich rozmów w aplikacji.
Po załączeniu pliku audio pojawia się nowa monitu „Talk Live About This”, pojawia się. Jednak pomimo tej obiecującej sugestii funkcjonalność przetwarzania dźwięku nie jest jeszcze w pełni operacyjna. Po przesłaniu pliku audio Gemini stara się obecnie zrozumieć lub odpowiedzieć na treść w znaczący sposób. W niektórych przypadkach aplikacja całkowicie ignoruje załączony plik audio, podczas gdy w innych może dostarczyć pewnych, ale sfabrykowanych informacji, zjawisko znane jako halucynacja chatbot, która nie jest wyłączna dla plików audio lub Gemini.
Pomimo aktualnych ograniczeń integracja obsługi plików audio jest zgodna z istniejącymi możliwościami Gemini po stronie programisty. API GEMINI obsługuje już dane wejściowe audio, umożliwiając programistom zasilanie opisów audio i żądań, streszczeń lub transkrypcji treści. API może również obsługiwać żądania specyficzne dla znacznika czasu, takie jak „od 2:30 do 3:29” i jest kompatybilny z różnymi formatami audio, w tym MP3, WAV i FLAC.
Sugeruje to, że Google prawdopodobnie opracowuje podobną solidną funkcję przetwarzania audio dla aplikacji na Androida. Chociaż obecna implementacja wydaje się być raczej symbolą zastępczą, a nie gotowym produktem, przejście do obsługi audio jest uważane za logiczny postęp, zwłaszcza biorąc pod uwagę, że przesyłanie obrazu są już szeroko dostępne w aplikacji Gemini. Nie ma oficjalnej harmonogramu pełnego uruchomienia tej funkcji.
Source: Gemini Android pozwala teraz użytkownikom przesyłać pliki audio








