Nowa aktualizacja Gemini 1.5 Pro dodaje możliwość słuchania plików audio, a następnie przetwarzania i wyodrębniania informacji tekstowych z tych klipów audio. Gemini potrafi przetwarzać różne typy plików audio na tekst w wielu różnych językach, aby pomóc użytkownikom łatwo uzyskać potrzebną im treść. Oto przewodnik po konwersji dźwięku na tekst w Gemini 1.5 Pro.
Jak przekonwertować dźwięk na tekst w Gemini 1.5 Pro
Krok 1:
Najpierw musisz uzyskać dostęp do witryny Gemini poświęconej przetwarzaniu dźwięku, klikając poniższy link.
Następnie przejdź do sekcji Model po prawej stronie i wybierz Gemini 1.5 Pro .

Krok 2:
Następnie użytkownik klika kartę Audio powyżej, aby pobrać plik audio, który chce przekonwertować na tekst.

Użytkownik zobaczy teraz opcje umożliwiające przesłanie dźwięku do Gemini 1.5 Pro w celu jego wykorzystania. Wybierz Dysk , aby pobrać dźwięk z Dysku Google.

W tym momencie użytkownik musi wyrazić zgodę na dostęp aplikacji Google AI Studio do swojego konta Google.

Krok 3:
Użytkownicy przesyłają plik audio do przetworzenia w systemie Gemini 1.5 Pro, wprowadzają żądanie, które chcą wykonać , a następnie naciskają niebieską, okrągłą ikonę wysyłania . Należy pamiętać, że każde konto będzie miało własną liczbę tokenów i za każdym razem, gdy przesyłasz plik audio, do przetworzenia przesłanego pliku potrzebna będzie inna liczba tokenów.

Krok 4:
Zaraz potem zobaczysz zawartość przeniesioną z ścieżki audio na Gemini 1.5 Pro, jak pokazano poniżej. Treść jest napisana jasno i szczegółowo, co pozwala użytkownikom łatwo ją zrozumieć.

Ta nowa funkcja w Gemini 1.5 Pro dotyczy wszystkich kont Google i nie wymaga rejestracji żadnych dodatkowych danych.