Opublikowano July 05, 2026•~15 min read

Jak tworzyć własne pakiety głosowe do aplikacji Waze za pomocą klonowania głosu opartego na sztucznej inteligencji

Przeszedłeś już przez wszystkie opcje z gwiazdami i nowościami, jakie oferuje Waze — Boy George, fragmenty z postaciami filmowymi, komików — a teraz chcesz czegoś bardziej osobistego. Twój własny głos prowadzący Cię w drodze do pracy. Albo głos członka rodziny. Właśnie tutaj pakiety głosowe waze stają się interesujące, ale też właśnie tutaj większość samodzielnych prób się załamuje. Wbudowany w Waze rejestrator niestandardowego głosu każe Ci przesiedzieć odliczanie i przeczytać na głos każdą pojedynczą instrukcję nawigacyjną, jedną po drugiej, zgodnie z poradnikiem Popular Science. Pomiń jakąś instrukcję, a otrzymasz ciszę dokładnie wtedy, gdy potrzebujesz wskazówek. Większość domowej roboty pakietów umiera gdzieś w okolicach frazy dziewięćdziesiątej siódmej, kiedy głos czytającego już się łamie, a entuzjazm znika. Klonowanie głosu AI odwraca obciążenie pracą: nagrywasz jedną czystą 20-sekundową próbkę, a potem hurtowo generujesz każdą frazę, której potrzebuje Waze — bez maratonu, bez zmęczenia. Pod koniec tego procesu będziesz mieć każdą frazę nawigacyjną wygenerowaną Twoim własnym sklonowanym głosem, gotową do wczytania. Będziemy też szczerzy co do kroku wczytywania, ponieważ Waze nie ma oficjalnego przycisku importu, a uczciwy obraz sytuacji wiąże się z realnymi zastrzeżeniami.

Overhead flat-lay on a wooden desk — a smartphone displaying a Waze turn-by-turn navigation screen, a USB condenser microphone on a small stand, a pop filter, and a handwritten notepad listing navigation phrases ("Turn left," "Recalcul

Spis treści

Czego tak naprawdę wymaga pakiet głosowy Waze (zanim cokolwiek nagrasz)
Wybór źródła głosu: nagrywanie na żywo w Waze vs. klonowanie z pomocą AI
Klonowanie Twojego głosu z 20-sekundowej próbki
Generowanie każdej frazy nawigacyjnej, której potrzebuje Waze
Wczytywanie Twojego niestandardowego pakietu do Waze (i realia na poziomie plików)
Idąc dalej: pakiety wielojęzyczne i współdzielenie jednego sklonowanego głosu
Twoja lista kontrolna budowy niestandardowego pakietu głosowego Waze
FAQ dotyczące niestandardowego głosu w Waze

Czego tak naprawdę wymaga pakiet głosowy Waze (zanim cokolwiek nagrasz)

Zanim dotkniesz mikrofonu, zrozum, co tak naprawdę budujesz. Pakiet głosowy Waze to nie mówiąca sztuczna inteligencja — to stała biblioteka nagranych wcześniej klipów wstawionych do konkretnych momentów nawigacji. Prawidłowe ustawienie tego modelu mentalnego uchroni Cię przed oczekiwaniem rzeczy, których Waze po prostu nie zrobi.

To stała biblioteka fraz, a nie mówiąca AI. Funkcja niestandardowego głosu w Waze to zasadniczo zamiennik notatki głosowej. Aplikacja odtwarza dokładnie ten klip, który dostarczyłeś dla każdego slotu z instrukcją. Nie uruchamia modelu, który wymawiałby dowolne nazwy ulic Twoim głosem. Niestandardowe głosy obejmują wyłącznie podstawowe wskazówki nawigacyjne — zakręty, zjazdy, odległości, podstawowe alerty i przybycie na miejsce. Nazwy ulic i dynamiczny tekst nadal odczytywane są przez domyślny głos systemowy. Więc Twój sklonowany głos mówi „Za 150 metrów skręć w lewo", a domyślny głos obsługuje „w Biscayne Boulevard". Świadomość tego z góry pozwala zachować realistyczne oczekiwania.

Lista fraz jest kompletna i obowiązkowa. Zgodnie z poradnikiem Popular Science dotyczącym procesu nagrywania w Waze, wymagana lista obejmuje powitania w rodzaju „Ruszajmy — jedź bezpiecznie!", instrukcje kierunkowe, takie jak „Zjedź czwartym zjazdem" i „Skręć w lewo", wskazówki dotyczące przeliczania trasy oraz komunikaty o przybyciu. Poradniki podkreślają, że musisz ukończyć całą wymaganą listę. Pozostaw frazy puste, a usłyszysz ciszę dokładnie w tych momentach nawigacji.

Każdy klip ma limit czasu. Waze pokazuje odliczanie podczas nagrywania i egzekwuje limity czasu na frazę. Każda fraza musi zmieścić się w kilku sekundach, w przeciwnym razie zostanie ucięta w połowie słowa. To wymusza zwięzłość, co ma znaczenie później, gdy dostrajasz wygenerowane audio, aby pasowało do tych okien czasowych.

Waze nie ma oficjalnego przycisku „importuj moje pliki MP3". Aplikacja udostępnia nagrywanie wyłącznie w samej aplikacji. Każda ścieżka wykorzystująca zewnętrznie wygenerowane audio — w tym klipy TTS sklonowane przez AI — opiera się na obejściach na poziomie plików, a nie na wspieranej funkcji. Będziemy o tym szczerze mówić przez cały czas. Jeśli chcesz oficjalnie wspieranej drogi, nagrywasz na żywo. Jeśli chcesz drogi generowanej przez AI, istnieje zaawansowany krok wstrzykiwania z realnymi wymaganiami wstępnymi.

Możesz później edytować pojedyncze klipy. Nie jesteś zamknięty w jednorazowej konstrukcji. Wróć do sekcji Głos i dźwięk, przesuń wpis niestandardowego głosu, aby odsłonić opcje, i ponownie nagraj konkretne frazy bez przebudowywania całego pakietu. Wątki wsparcia w Społeczności Waze potwierdzają ten proces edycji poszczególnych klipów, co jest ulgą, gdy pierwsza fraza wyjdzie źle.

Wybór źródła głosu: nagrywanie na żywo w Waze vs. klonowanie z pomocą AI

Do gotowego pakietu prowadzą dwie realne ścieżki. Nagrywasz każdą frazę na żywo w Waze albo klonujesz głos raz i hurtowo generujesz każdą frazę jako mowę z tekstu. Oto jak wypadają w porównaniu pod kątem czynników, które naprawdę zadecydują o Twoim weekendzie.

Czynnik	Nagrywanie na żywo w Waze	Klonowanie głosu AI + TTS
Czas ukończenia pełnej listy	Długi — czytanie każdej frazy pod presją czasu	Szybki — sklonuj raz, generuj hurtowo
Spójność między frazami	Pogarsza się w miarę zmęczenia w połowie listy	Jednolity ton i tempo przez cały czas
Poprawianie błędu	Ręczne ponowne nagranie klipu	Ponowne wygenerowanie linii z tekstu
Użycie głosu innej osoby	Tylko jeśli jest obecna, by nagrać na żywo	Możliwe z próbki — wymagana zgoda
Skalowanie na więcej języków	Niepraktyczne (ponowne nagranie na język)	Jeden głos generuje wiele języków
Wczytywanie do Waze	W pełni wspierane, w aplikacji	Wymaga obejścia na poziomie plików

Uczciwy kompromis tkwi w tym ostatnim wierszu. Nagrywanie na żywo to oficjalnie wspierana droga do Waze — czysta, bez dostępu root, działa na każdym telefonie. Sklonowane audio wygrywa pod względem spójności i objętości, ale wymaga niewspieranego kroku wstrzykiwania. Wybierz na podstawie tego, który ból wolisz znieść: maraton nagrywania czy majsterkowanie na poziomie plików.

Dla większości osób budujących pełny pakiet, klonowanie głosu AI to lepsze wykorzystanie czasu. Nigdy się nie zmęczysz, każdy klip pasuje pod względem tonu i tempa, a poprawienie złej linii oznacza edytowanie tekstu, a nie ponowne nagrywanie pod presją odliczania. Sama spójność jest tego warta — pakiet, w którym fraza trzecia i fraza dziewięćdziesiąta brzmią identycznie, sprawia profesjonalne wrażenie w sposób, jaki ręczna sesja rzadko osiąga.

Warto tu wskazać granicę etyczną. Klonowanie własnego głosu w celu personalizacji jest oczywiście w porządku. Klonowanie cudzego wymaga wyraźnej zgody. Organy regulacyjne traktują głos jako część chronionego wizerunku osoby — FTC powołuje się w tej kwestii na ustawę ELVIS Act stanu Tennessee — a zgodnie z wytycznymi FTC dotyczącymi klonowania głosu wspomaganego przez AI, „nie ma żadnego wyłączenia dla AI od obowiązujących przepisów prawa". Miej to na uwadze, jeśli budujesz pakiet głosem przyjaciela lub członka rodziny. Pełen aspekt etyczny omawiamy w FAQ.

Nagrywanie stu fraz nawigacyjnych za jednym posiedzeniem to miejsce, gdzie umiera większość samodzielnych pakietów głosowych — klon AI nigdy nie męczy się przy frazie dziewięćdziesiątej siódmej.

Klonowanie Twojego głosu z 20-sekundowej próbki

Krok klonowania to prawdziwie wykonalna część tego projektu. Nowoczesne narzędzia do natychmiastowego klonowania sprowadziły to, co kiedyś wymagało sesji studyjnej, do kilku minut konfiguracji. Oto sekwencja.

Zarejestruj czystą próbkę. Znajdź cichy, akustycznie wytłumiony pokój — miękkie meble, zamknięte okna, brak szumu klimatyzacji. Bez muzyki, bez rozmów w tle. Mów w naturalnym, równym tempie, tak jak naprawdę udzielałbyś wskazówek. Warto poznać pewną rozbieżność z rzeczywistością: wielu dostawców, w tym wytyczne treningowe LALAL.AI, zaleca 10–50 minut nagrania dla modeli o najwyższej wierności. Ale nowoczesne narzędzia do natychmiastowego klonowania produkują użyteczne głosy z zaledwie 20 sekund do minuty, co usługi klonowania z krótkich próbek, takie jak NoteGPT, wyraźnie zaznaczają. Krótkie próbki wymieniają odrobinę spójności na ogromny zysk w szybkości — właściwy wybór dla pakietu nawigacyjnego.
Prześlij do narzędzia do klonowania głosu. Wrzuć plik z próbką do interfejsu klonowania i poczekaj, aż model go przetworzy. To tutaj opcja szybkiego działania z 20 sekund się opłaca — sklonuj swój głos z krótkiego klipu, zamiast blokować godzinę na czytanie. Programiści automatyzujący budowy wielu głosów mogą sterować tym samym procesem przez API klonowania głosu zamiast interfejsu.
Zweryfikuj jakość. Zanim zdecydujesz się wygenerować sto klipów, wygeneruj jedną frazę testową — „Za 150 metrów skręć w lewo" jest idealne, ponieważ zawiera liczbę, jednostkę odległości i wskazówkę kierunkową. Wsłuchaj się w naturalność, poprawny akcent i czystą artykulację. Głos, któremu zaufasz przy prędkości autostradowej, musi się sprawdzić w rzeczywistych warunkach, więc przetestuj go tak, jak naprawdę go usłyszysz.
Nazwij i zapisz głos, wraz z metadanymi. Ustaw znaczniki języka i akcentu przy zapisywaniu. Ma to znaczenie dla późniejszego kroku wielojęzycznego — poprawnie oznaczony głos czysto reużywa się między językami w potoku TTS. Platformy klonowania pozwalają dołączyć opisowe metadane, dzięki czemu ta sama persona jest łatwa do ponownego przywołania dla kolejnego pakietu.

Głos, któremu zaufasz przy prędkości autostradowej, musi brzmieć spokojnie i wyraźnie przy prędkości autostradowej — przetestuj jedną frazę, zanim wygenerujesz sto.

Close-up of a laptop screen showing a voice-cloning upload interface with an audio waveform displayed and a "Clone Voice" button, hands resting near the trackpad, soft desk lighting.

To jest rdzeń całej budowy. Gdy Twój klon jest gotowy, generujesz każdą frazę, jakiej oczekuje Waze, jako osobny plik audio. Zacznij od poznania, jak wygląda pełna lista, uporządkowana według kategorii.

Kategoria	Przykładowe frazy
Powitania	„Ruszajmy — jedź bezpiecznie!"
Zakręty	„Skręć w lewo", „Skręć w prawo", „Trzymaj się prawej"
Zjazdy i odległości	„Zjedź czwartym zjazdem", „Za 150 metrów skręć w lewo"
Przeliczanie trasy	„Przeliczam trasę", „Trasa zaktualizowana"
Alerty	Potwierdzenia dotyczące fotoradaru / zagrożenia
Przybycie	„Dotarłeś do celu"

Mając zmapowane kategorie, przeprowadź proces generowania:

Pobierz kompletną wymaganą listę fraz z procesu Dodaj głos w Waze. Rozpocznij niestandardowy głos w aplikacji i nagraj zaślepki na próbę, aby odsłonić każdy slot. Zapisz każdy z nich. Musisz uwzględnić każdą frazę — brakująca fraza oznacza, że Waze zamilknie przy tej wskazówce, zgodnie z poradnikiem Popular Science.
Wklej każdą frazę do Text to Speech, używając sklonowanego głosu. Generuj hurtowo wszystkie linie przez Text to Speech, zamiast pojedynczo. Dla każdego, kto skryptuje powtarzalną budowę, API Text to Speech zamienia całą listę fraz w jedno zautomatyzowane przejście.
Dostrój tempo i interpunkcję, aby frazy o odległości brzmiały naturalnie. Zapisz „Za 150 metrów… skręć w lewo" z przecinkiem lub wielokropkiem, aby kontrolować rytm i pauzy. Trzymaj każdy klip w kilkusekundowym limicie czasu Waze — fraza, która trwa zbyt długo, zostanie ucięta w połowie słowa po wczytaniu.
Wyeksportuj każdą linię jako osobny plik audio, nazwany dokładnie tak, aby pasował do slotu frazy oczekiwanego przez Waze. To dopasowanie nazw plików jest szczegółem decydującym o sukcesie lub porażce. Dyskusja społeczności na GitHub dokumentująca podejście z podmianą plików potwierdza, że Waze odczytuje każdą frazę po jej dokładnej nazwie pliku. Pomyl się w jednej, a ta wskazówka zamilknie.

Tajemnicą nie jest głos — jest nią nazwanie każdego klipu dokładnie tak, jak Waze oczekuje go usłyszeć.

Infographic: How AI Turns One Sample Into a Full Waze Pack

Wczytywanie Twojego niestandardowego pakietu do Waze (i realia na poziomie plików)

To tutaj uczciwość ma największe znaczenie. Istnieją dwie rzeczywistości w zależności od tego, czy nagrałeś na żywo, czy wygenerowałeś audio zewnętrznie.

Wspierana ścieżka (w aplikacji). Jeśli nagrałeś na żywo, droga jest czysta i działa na każdym telefonie: Waze → Ustawienia → Głos i dźwięk → wybierz swój aktualny głos → „Dodaj głos" → zaakceptuj ostrzeżenie o bezpieczeństwie → nazwij głos → nagraj każdą frazę czerwonym przyciskiem nagrywania, aż lista będzie kompletna. Bez dostępu root, bez majsterkowania. To oficjalnie wspierany sposób, w jaki niestandardowe pakiety głosowe waze trafiają do aplikacji, i jest to droga, którą większość ludzi powinna obrać, jeśli generowanie AI nie jest twardym wymogiem.

Ścieżka zaawansowana (zewnętrzne sklonowane audio). Ponieważ Waze nie udostępnia oficjalnego przycisku importu, społecznościowe procesy podmiany plików MP3 idą okrężną drogą. Tworzysz nowy niestandardowy głos, nagrywasz bardzo krótkie zaślepki dla każdej frazy, zapisujesz i nazywasz pakiet, a następnie pozostawiasz ekran edycji otwarty. Z wciąż aktywnym edytorem używasz eksploratora plików z dostępem root, aby zastąpić każdy tymczasowy plik w katalogu niestandardowych fraz Waze — na Androidzie /data/user/0/com.waze/waze/custom_prompts_temp — podmieniając na swoje zewnętrznie wygenerowane pliki MP3, zachowując dokładne nazwy plików oczekiwane przez Waze. Bądź świadomy wymagań wstępnych: potrzebne jest zrootowane lub emulowane środowisko Android, a zgodnie z dyskusją społeczności na GitHub dokumentującą tę metodę, jest to oznaczone jako potencjalnie ryzykowne dla kont osobistych. To nie jest krok dla początkujących ani przyjazny dla iOS.

Rozwiązywanie najczęstszych problemów:

Ciche frazy oznaczają brakujący lub błędnie oznaczony plik. Sprawdź, czy nazwa pliku dokładnie pasuje do slotu — to najczęstsza pojedyncza przyczyna zepsutego pakietu.
Ucięty klip przekroczył limit czasu Waze na frazę. Wygeneruj tę linię ponownie krócej i podmień z powrotem.
Chcesz zmienić jedną linię bez przebudowywania? Przesuń wpis niestandardowego głosu w Głos i dźwięk, aby odsłonić opcje edycji i nadpisz ten pojedynczy klip, jak opisują wytyczne Społeczności Waze.

A smartphone held in one hand showing the Waze "Voice and sound" settings screen with a voice-selection list visible, car interior softly blurred in the background.

Idąc dalej: pakiety wielojęzyczne i współdzielenie jednego sklonowanego głosu

Pojedynczy angielski pakiet to punkt wejścia, a nie sufit. Prawdziwy zysk z drogi klonowania ujawnia się, gdy zaczniesz ponownie wykorzystywać ten głos.

Jeden głos, wiele języków. Ponieważ sklonowany głos żyje wewnątrz potoku TTS, możesz wygenerować tę samą listę fraz nawigacyjnych w dodatkowych językach, używając tej samej sklonowanej persony. Ręczne nagrywanie nigdy nie uczyniło tego praktycznym — musiałbyś ponownie nagrać każdą frazę, w każdym języku, głosem, który musiał jakoś pozostać spójny między nimi wszystkimi. Platformy klonowania pozwalają wybrać język i akcent przy ponownym użyciu głosu, więc persona zostaje przeniesiona. Dzięki lokalizacji na 33 języki docelowe dostępnej poprzez AI Dubbing, jedna nagrana persona może narratorsko prowadzić tę samą jazdę na wielu rynkach. Wygeneruj angielski pakiet, potem przepuść identyczną listę fraz przez dodatkowe języki, a zbudujesz pięć pakietów z jednej sesji nagraniowej.

Pakiety dla rodziny i flot. Ta sama możliwość ponownego użycia otwiera głosy wykraczające poza Twój własny. Zbuduj pakiet głosem członka rodziny — przy czym każda osoba nagrywa swoją własną 20-sekundową próbkę i wyraża wyraźną zgodę — aby dzieci słyszały wskazówki rodzica podczas podróży samochodowej. Firmy mogą pójść dalej: markowy głos nawigacji dla floty dostawczej, firmy szkolącej kierowców lub operacji przewozów. Dla zespołów budujących to na dużą skalę, API AI Dubbing pozwala programistom wpiąć cały proces generowania i lokalizacji do istniejącego systemu, zamiast robić to ręcznie.

Zachowaj wielokrotnego użytku szablon listy fraz. Oto zasób, który procentuje: gdy raz złożysz główną listę fraz i mapę nazw plików, możesz w kilka minut wygenerować cały pakiet dla dowolnego nowego głosu lub języka. Szablon — dokładne frazy plus dokładne nazwy plików oczekiwane przez Waze — jest wart więcej niż jakikolwiek pojedynczy pakiet. Zbuduj go starannie raz, a każdy przyszły pakiet będzie szybką robotą.

Dyscyplina zgody i przechowywania. Traktuj sklonowane głosy jak wrażliwe dane biometryczne. Odciski głosowe są coraz częściej wykorzystywane do uwierzytelniania, dlatego starszy technolog kadrowy ACLU Daniel Kahn Gillmor nakłania projektantów do ograniczania sposobu przechowywania i udostępniania sklonowanych głosów. Zgoda i wyraźne oznakowanie to to, co oddziela etyczną personalizację od nadużyć — Sam Gregory z organizacji non-profit zajmującej się prawami człowieka WITNESS ujmuje różnicę jako kwestię zgody i kontekstu: wyraźnie oznaczony klon Twojego własnego głosu to zupełnie coś innego niż narzędzie zbudowane, by podszywać się pod kogoś dla korzyści. Badacz deepfake'ów z UC Berkeley Hany Farid ostrzegał, że media syntetyczne stają się „tanie, szybkie i łatwe", co jest dokładnie powodem, dla którego dyscyplina ma znaczenie nawet w nieszkodliwym projekcie nawigacyjnym. Praktyczna zasada pozostaje prosta: Twój własny głos jest w porządku, cudzy potrzebuje wyraźnego pozwolenia.

Dlaczego skonsolidowany proces ma znaczenie. Ręczna alternatywa to żonglowanie osobnymi narzędziami — jednym do klonowania, drugim do TTS, trzecim do tłumaczenia — i ręczne zszywanie ich wyników. Pojedynczy proces łączący klonowanie głosu z Text to Speech i lokalizacją to powód, dla którego nie uruchamiasz pięciu narzędzi równolegle. Jeden głos, sklonowany raz, używany ponownie wszędzie.

Jeden głos, sklonowany raz, może narratorsko prowadzić tę samą jazdę w trzydziestu trzech językach — to część, której ręczne nagrywanie nigdy nie umożliwiło.

Infographic: One Cloned Voice, Many Language Packs

Twoja lista kontrolna budowy niestandardowego pakietu głosowego Waze

Przejdź przez tę sekwencję od góry do dołu, a będziesz mieć gotowe pakiety głosowe waze bez maratonu nagrywania. Każdy krok to pojedyncza, konkretna czynność.

Nagraj czystą 20-sekundową próbkę — cichy pokój, naturalne tempo, bez muzyki i szumu w tle.
Stwórz klon — prześlij próbkę, poczekaj na przetworzenie, potem wygeneruj frazę testową, aby potwierdzić jakość, zanim pójdziesz dalej.
Pobierz główną listę fraz Waze — rozpocznij niestandardowy głos w aplikacji, zanotuj każdy wymagany slot frazy i nie pomiń niczego.
Wygeneruj hurtowo wszystkie frazy za pomocą Text to Speech — używając sklonowanego głosu, dostrojonego pod kątem tempa i do zmieszczenia się w limitach czasu Waze na klip.
Nazwij każdy plik zgodnie ze specyfikacją — dopasuj do dokładnych nazw plików Waze. To tutaj pakiety się psują, więc sprawdź dwa razy.
Wczytaj do Waze — nagraj na żywo w aplikacji dla czystej wspieranej drogi lub (zaawansowane) podmień pliki poprzez katalog niestandardowych fraz na zrootowanej konfiguracji Android.
Przetestuj podczas jazdy i wygeneruj ponownie niezgrabne linie — słuchaj przy rzeczywistej prędkości jazdy i nadpisz każdy klip, który jest ucięty, źle zsynchronizowany w czasie lub nienaturalny.
(Opcjonalnie) Zduplikuj w dodatkowych językach — użyj ponownie tego samego klonu, aby wygenerować pakiety w innych językach docelowych z identycznego szablonu fraz.

Wszystko zaczyna się od jednego nagrania. Ustaw telefon gdzieś w cichym miejscu i nagraj tę pierwszą 20-sekundową próbkę już teraz — wszystko inne z niej wynika.

FAQ dotyczące niestandardowego głosu w Waze

Czy klonowanie czyjegoś głosu do mojego pakietu Waze jest legalne? Klonowanie własnego głosu do osobistej nawigacji jest w porządku. Klonowanie cudzego wymaga wyraźnej zgody. FTC podkreśla, że „nie ma żadnego wyłączenia dla AI od obowiązujących przepisów prawa", a stany takie jak Tennessee — poprzez ustawę ELVIS Act, na którą FTC się powoływało — traktują głos jako chroniony wizerunek. Ponad 75 000 konsumentów podpisało w 2025 roku petycję, zorganizowaną przez zespół rzeczniczy Consumer Reports, wzywającą FTC do rozprawienia się z oszustwami związanymi z klonowaniem głosu, więc nadużycia są traktowane poważnie. Dla osobistego pakietu we własnym głosie nic z tego nie stanowi bariery. Dla głosu kogokolwiek innego, uzyskaj najpierw wyraźne pozwolenie.

Czy nadal mogę użyć wbudowanego rejestratora Waze, aby stworzyć głos? Tak. Wbudowany rejestrator „Dodaj głos" w sekcji Głos i dźwięk nadal działa dokładnie jak wcześniej — nagrywasz każdą frazę na żywo w ramach odliczania. Droga AI nie zastępuje tej funkcji; zastępuje żmudną sesję nagraniową wygenerowanymi klipami. Jeśli wolisz nie zajmować się obejściami na poziomie plików, nagrywanie na żywo pozostaje w pełni wspieraną opcją.

Dlaczego mój niestandardowy głos pomija niektóre frazy? Pominięta fraza oznacza brakujący lub błędnie oznaczony plik audio. Każdy slot frazy potrzebuje poprawnie nazwanego klipu, w przeciwnym razie Waze zamilknie przy tej wskazówce. Dyskusja o metodzie podmiany plików na GitHub i wytyczne Społeczności Waze wskazują na to samo rozwiązanie: ponownie sprawdź nazwy plików względem dokładnych slotów oczekiwanych przez Waze lub ponownie nagraj konkretną frazę w aplikacji.

Czy niestandardowe pakiety głosowe działają zarówno na iPhone, jak i Android? Nagrywanie w aplikacji działa na wszystkich platformach — użytkownicy iPhone i Android mogą zbudować głos nagrany na żywo. Zaawansowane obejście z podmianą plików do wstrzykiwania wygenerowanych przez AI plików MP3 jest udokumentowane dla katalogu plików Androida i wymaga zrootowanego lub emulowanego środowiska. Zgodnie z dyskusją społeczności na GitHub, nie jest to czysta droga dla iOS, więc jeśli chcesz konkretnie drogi generowanej przez AI, planuj wokół Androida.