Jak konwertować tekst na mowę za pomocą sztucznej inteligencji z ElevenLabs

Jak konwertować tekst na mowę za pomocą sztucznej inteligencji z ElevenLabs

Co wiedzieć

  • Musisz najpierw zarejestrować się w ElevenLabs i utworzyć własne konto.
  • Ustaw ustawienia mowy w sekcji „Synteza mowy”, wprowadź tekst i kliknij „Generuj”, aby przekonwertować na mowę.
  • możesz tworzyć nowe głosy w „VoiceLab” i pobierać wygenerowaną mowę w „Historii”.

Powstanie generatywnej sztucznej inteligencji przyniosło wiele wspaniałych narzędzi. Od chatbotów po sztukę generatywną — nie brakuje narzędzi nowej ery, które pomogą użytkownikom osiągnąć nowe wyżyny w swojej pracy.

Jednym z wielu darów renesansu sztucznej inteligencji są narzędzia głosowe AI, które konwertują dowolny tekst na mowę, która brzmi naturalnie i nie ma żadnego wrażenia robotycznego, które zwykle kojarzymy z takimi narzędziami.

Chociaż istnieje kilka takich konwerterów tekstu na mowę AI, ElevenLabs jest zdecydowanie jednym z liderów w branży. Zobaczmy, jak możesz użyć ElevenLabs do konwersji tekstu na mowę, tworzenia własnych głosów i pobierania wygenerowanej zawartości mowy.

Co to jest ElevenLabs?

Założona w 2022 roku firma ElevenLabs to oprogramowanie do syntezy mowy, które wykorzystuje sztuczną inteligencję i głębokie uczenie się do generowania bardzo realistycznej i naturalnie brzmiącej ludzkiej mowy z tekstu.

Chociaż bezpłatny plan obejmuje dziewięć różnych próbek głosu, które możesz wypróbować, i tekst o wartości 10 000 znaków, który możesz przekonwertować na mowę miesięcznie, płatne plany ElevenLabs pozwalają zrobić znacznie więcej. Dzięki planom Starter i Creator użytkownicy mogą pracować odpowiednio z 30 000 i 100 000 znaków miesięcznie, a nawet sklonować własny głos lub głos, do którego masz pozwolenie.

Jak używać ElevenLabs do konwersji tekstu na mowę za pomocą sztucznej inteligencji

W tym przewodniku użyjemy bezpłatnego planu z wystarczającą liczbą funkcji i limitem znaków, aby zacząć. W tym celu wykonaj czynności podane poniżej:

1. Zarejestruj się w ElevenLabs

Po pierwsze, jeśli nie jesteś jeszcze na stronie ElevenLabs, skorzystaj z poniższego łącza, aby się tam dostać.

JedenaścieLabs | Link do strony

Tam najpierw będziesz musiał się zarejestrować. Więc kliknij Zarejestruj się w prawym górnym rogu.

Zaznacz pole, które mówi, że zgadzam się na warunki korzystania z usługi . Następnie wprowadź swój adres e-mail/hasło lub użyj konta Google lub Facebook.

Po zarejestrowaniu zostaniesz przeniesiony bezpośrednio na stronę Plany cenowe.

Możesz nadal korzystać z bezpłatnego planu lub subskrybować płatne plany. Ale jeśli używasz generatora zamiany tekstu na mowę ElevenLabs po raz pierwszy, zalecamy wypróbowanie go najpierw z bezpłatnym planem.

2. Wybierz Ustawienia mowy

Aby rozpocząć korzystanie z narzędzia zamiany tekstu na mowę, kliknij Synteza mowy .

Tutaj możesz zmienić ustawienia mowy przed wygenerowaniem mowy z tekstu. Pierwsze pole pozwoli ci wybrać spośród gotowych opcji mowy. Kliknij menu rozwijane, aby wyświetlić opcje.

Kliknij przycisk odtwarzania obok jednego, aby usłyszeć próbkę głosu i wybierz tę, która dzwoni prosto do twoich uszu.

Drugie pole to Ustawienia głosu.

Pozwala to dostosować stabilność i wyrazistość generowanej mowy.

Niższa wartość Stabilności sprawi, że mowa będzie bardziej wyrazista z dużą zmiennością między regeneracjami, ale może też prowadzić do niestabilności. Wyższa wartość zapewni spójność mowy między wieloma pokoleniami, ale może też stać się monotonna. Idealnie byłoby obniżyć tę wartość dla dłuższych tekstów i odwrotnie.

Wartości przejrzystości dostosowują się do przypadkowych artefaktów w generowanej mowie. Aby zminimalizować artefakty, wybierz niższą wartość. Aby poprawić przejrzystość, wybierz wyższą wartość. Jednak po raz pierwszy pozwól tym dwóm pozostać na wartości domyślnej.

Na koniec mamy możliwość wyboru modelu językowego.

Jeśli Twój tekst jest w języku angielskim, wybierz pierwszy model Eleven Monolingual v1. Alternatywnie wybierz model Eleven Multilingual v1, aby pracować z tekstem w języku angielskim, niemieckim, polskim, hiszpańskim, włoskim, portugalskim i hindi.

3. Wprowadź tekst i wygeneruj mowę

Po wybraniu ustawień głosu i modelu pozostaje tylko przenieść tekst do pola tekstowego.

Następnie kliknij Generuj .

Twój tekst zostanie teraz odczytany na głos. Przejrzyj tekst w trakcie jego wypowiadania, aby określić, czy wymaga on jakichś zmian.

Zaprojektuj nowy głos

Gotowe głosy są więcej niż wystarczające, aby zacząć. Ale jeśli nie zrobią tego dla ciebie, możesz sam zaprojektować nowy głos. Aby to zrobić, najpierw kliknij VoiceLab u góry.

Następnie kliknij Dodaj generatywny lub sklonowany głos .

Dla bezpłatnych użytkowników dostępna będzie tylko opcja Voice Design .

W oknie tworzenia głosu wybierz Płeć, Wiek, Akcent i Siłę akcentu, a następnie kliknij Generuj , aby go odsłuchać.

Jeśli Ci się spodoba, kliknij Użyj głosu .

Nadaj głosowi nazwę i wybierz opcję Utwórz głos .

Pobierz wygenerowane próbki zamiany tekstu na mowę

ElevenLabs, oprócz możliwości generowania mowy z tekstu, umożliwia również pobieranie wygenerowanej mowy jako plików MP3. Aby to zrobić, kliknij Historia u góry.

Tutaj znajdziesz pełną listę wygenerowanych treści mowy. Wybierz ten, który chcesz pobrać.

Następnie kliknij Pobierz wybrane .

I tak po prostu zostanie pobrana wygenerowana próbka zamiany tekstu na mowę.

Zrób więcej z ElevenLabs

Bezpłatny plan ElevenLabs umożliwia konwersję tekstu na mowę dla około 10 000 znaków miesięcznie i zaprojektowanie trzech nowych głosów. Ale dzięki płatnym planom możesz zrobić znacznie więcej.

Za 5 USD miesięcznie pakiet startowy umożliwia utworzenie 10 niestandardowych głosów, sklonowanie głosu i konwersję do 30 000 znaków tekstowych miesięcznie.

Za 22 USD miesięcznie pakiet Creator umożliwia tworzenie 30 niestandardowych głosów, sklonowanie własnego głosu, konwersję do 100 000 znaków miesięcznie i pobieranie wysokiej jakości plików audio.

Aby uzyskać dodatkowe funkcje i bardziej liberalne limity znaków, możesz skorzystać z planu Independent Publisher (99 USD miesięcznie) lub Growing Business (330 USD miesięcznie).

Często zadawane pytania

Rzućmy okiem na kilka często zadawanych pytań dotyczących ElevenLabs.

Czy niewykorzystane postacie przechodzą na następny miesiąc?

Nie, niewykorzystane znaki nie przechodzą na następny miesiąc, a znaki są resetowane na początku nowego miesiąca.

Ile znaków tekstowych mogę jednocześnie przekonwertować na mowę?

W jednym żądaniu użytkownicy bezpłatni mogą przekonwertować 2500 znaków tekstowych. Użytkownicy subskrybujący płatne plany mogą konwertować do 5000 znaków na żądanie.

Czy mogę konwertować tekst w językach innych niż angielski?

Tak, możesz konwertować tekst w języku angielskim, niemieckim, polskim, hiszpańskim, włoskim, francuskim, portugalskim i hindi. Jednak z wyjątkiem języka angielskiego jest to możliwe tylko w przypadku płatnych planów.

Konwerter tekstu na mowę firmy ElevenLabs jest bez wątpienia jednym z najlepszych narzędzi dostępnych obecnie na rynku, które pomagają odsłuchiwać dokumenty tekstowe i słyszeć, jak brzmią. Dla autorów i wydawców to spełnienie marzeń. Ale nawet dla hobbystów lub twórców treści szukających ludzkiej narracji, ElevenLabs jest idealnym narzędziem do pracy. Mamy nadzieję, że ten przewodnik pomógł Ci w generowaniu tekstu na mowę dla Twoich dokumentów. Do następnego razu!

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *