ChatGPT to potężny model językowy, zdolny do generowania tekstu niezwykle podobnego do ludzkiego.
Jeśli jednak odpowiedzi te są odczytywane na głos przy użyciu funkcji zamiany tekstu na mowę (TTS), mogą czasami mieć charakter sztuczny lub automatyczny.
Jeśli Twoim celem jest szokująco naturalny dźwięk mówiony, czas dodać trochę pikanterii do tej mieszanki! Przyjrzyjmy się technikom pozwalającym uzyskać wrażenie autentycznej mowy.
Jak poprawić wyniki ChatGPT
W codziennych rozmowach ludzie rzadko mówią perfekcyjnie zbudowanymi, poprawnymi gramatycznie zdaniami. Używamy słów wypełniających, takich jak „um”, „uh”, „jak” i „wiesz”. Może się to wydawać bałaganem werbalnym, ale w rzeczywistości pełnią ważną funkcję w mowie naturalnej.
Możesz poinstruować funkcję głosową ChatGPT, aby strategicznie uwzględniała te wypełniacze w swoich odpowiedziach. Dzięki temu będzie brzmiało bardziej konwersacyjnie.
Oto przykład:
- Podpowiedź: Wyjaśnij różnicę między pogodą a klimatem.
- Ulepszony monit: Czy mógłbyś wyjaśnić, hm, różnicę między pogodą a klimatem? Może użyj też kilku „lajków” i „wiesz”.
Systemy TTS zamienią te słowa wypełniające na pauzy i wahania, dzięki czemu dźwięk będzie bardziej organiczny. Eksperymentuj, aby znaleźć odpowiedni poziom dla swojego pożądanego stylu!
Oto oryginalna odpowiedź:
A oto odpowiedź z naszym poprawionym monitem:
Poza tym ludzie naturalnie używają skrótów w mowie potocznej. „Nie można” staje się „nie można”, „jest” staje się „jest” i tak dalej. Sprawiają one, że mowa jest płynniejsza i sprawia wrażenie konwersacji. Możesz zachęcić ChatGPT do używania skrótów w celu uzupełnienia swojego „ludzkiego” wzorca mowy.
Prawdziwa mowa ludzka ma różny ton. Używamy zmian w tonacji, głośności i szybkości, aby podkreślić słowa lub dodać emocji. Oto, gdzie ukierunkowana interpunkcja może pomóc Twojemu TTS:
- Dodawanie przecinków w przypadku pauz: „Dzisiaj jest słonecznie, ciepło i idealnie na wycieczkę”.
- Wykrzykniki oznaczające podekscytowanie: „Ten film był niesamowity! Zakończenie bardzo mi się podobało.”
- Znaki zapytania wyrażają ciekawość: „Zawsze zastanawiałem się, w jaki sposób ptaki uczą się latać?”
Praktyka czyni postęp
Jak w przypadku każdej umiejętności, uczynienie mowy ChatGPT bardziej naturalnym dźwiękiem wymaga praktyki. Wypróbuj różne kombinacje technik. Zwróć uwagę na swoje ulubione podcasty lub audiobooki, aby zobaczyć, jak profesjonalni mówcy świetnie wykorzystują modulację głosu i słowa wypełniające.
Pamiętaj, że nie ma jednego „właściwego” sposobu, aby to zrobić!
Uwaga na temat systemów zamiany tekstu na mowę
Jakość systemu TTS również odgrywa dużą rolę. Niektórzy lepiej niż inni interpretują znaki interpunkcyjne w celu uzyskania realistycznej wymowy.
Popularne opcje obejmują:
Kiedy mniej może oznaczać więcej?
Choć naturalnie brzmiące dane wyjściowe ChatGPT są w wielu przypadkach doskonałe, zdarzają się sytuacje, w których właściwe jest dostarczanie bardziej formalne lub „zrobotyzowane”. Pomyśl o tych scenariuszach:
- Dostarczanie wiadomości lub informacji opartych na faktach: Tutaj liczy się zwięzłość i przejrzystość.
- Dostępność: Niektórzy użytkownicy mogą uznać za mylące zbyt wiele wypełniaczy lub zmian tonalnych.
Wszystko polega na znalezieniu najlepszego rozwiązania, które zapewni pożądany efekt!
Autor wyróżnionego obrazu: Jasona Leunga/Usuń rozpryski
Source: Jak stworzyć naturalnie brzmiące wyjście ChatGPT?