Como converter texto em fala usando AI com ElevenLabs

Como converter texto em fala usando AI com ElevenLabs

o que saber

  • Você precisa se inscrever no ElevenLabs e criar sua própria conta primeiro.
  • Defina as configurações de fala em ‘Síntese de fala’, insira seu texto e clique em ‘Gerar’ para converter em fala.
  • você pode criar novas vozes em ‘VoiceLab’ e pode baixar a fala gerada em ‘Histórico’.

A ascensão da IA ​​generativa gerou muitas ferramentas excelentes. De chatbots a arte generativa, não faltam ferramentas da nova era para ajudar os usuários a alcançar novos patamares com seu trabalho.

Um dos muitos presentes do renascimento da IA ​​são as ferramentas de voz de IA que convertem qualquer texto em fala com som natural e não têm nenhuma das sensações robóticas que normalmente associamos a essas ferramentas.

Embora existam alguns desses conversores de texto em fala AI por aí, o ElevenLabs é definitivamente um dos pioneiros na indústria hoje. Vamos ver como você pode usar o ElevenLabs para converter texto em fala, criar suas próprias vozes e baixar o conteúdo de fala gerado.

O que é ElevenLabs?

Fundado em 2022, o ElevenLabs é um software de síntese de fala que utiliza IA e aprendizado profundo para gerar fala humana muito realista e com som natural a partir de texto.

Embora seu plano gratuito tenha nove amostras de voz diferentes que você pode experimentar e 10.000 caracteres de texto que você pode converter em fala por mês, os planos pagos do ElevenLabs permitem que você faça muito mais. Com os planos Starter e Creator, os usuários podem trabalhar com 30.000 e 100.000 caracteres por mês, respectivamente, e até mesmo clonar a própria voz ou uma voz que você tenha permissão para usar.

Como usar o ElevenLabs para converter texto em fala usando IA

Para este guia, usaremos o plano gratuito com recursos e cota de caracteres suficientes para você começar. Siga as etapas abaixo para fazer isso:

1. Inscreva-se no ElevenLabs

Em primeiro lugar, se você ainda não estiver no site da ElevenLabs, use o link abaixo para chegar lá.

ElevenLabs | Link do site

Uma vez lá, você primeiro será obrigado a se inscrever. Então clique em Cadastre-se no canto superior direito.

Marque a caixa que diz Eu concordo com os termos de serviço . Em seguida, digite seu e-mail/senha ou use sua conta do Google ou Facebook.

Depois de se inscrever, você será direcionado diretamente para a página Planos de preços.

Você pode continuar usando seu plano gratuito ou assinar os planos pagos. Mas se esta é a primeira vez que usa o gerador de conversão de texto em fala da ElevenLabs, recomendamos experimentá-lo primeiro com o plano gratuito.

2. Escolha Configurações de fala

Para começar a usar a ferramenta de conversão de texto em fala, clique em Síntese de fala .

Aqui, você pode alterar as configurações de fala antes de gerar a fala a partir do texto. O primeiro campo permitirá que você selecione entre as opções de fala predefinidas. Clique no menu suspenso para revelar as opções.

Clique no botão play ao lado de um para ouvir a amostra de voz e selecione aquele que soa bem em seus ouvidos.

O segundo campo é Configurações de voz.

Isso permite ajustar a estabilidade e a clareza da fala gerada.

Um valor de Stability mais baixo tornará a fala mais expressiva com alta variabilidade entre a regeneração, mas também pode levar a instabilidades. Um valor mais alto manterá o discurso consistente entre várias gerações, mas também pode se tornar monótono. O ideal é diminuir esse valor para textos mais longos e vice-versa.

Os valores de clareza são ajustados para artefatos aleatórios na fala gerada. Para minimizar os artefatos, selecione um valor mais baixo. Para melhorar a clareza, selecione um valor mais alto. Pela primeira vez, no entanto, deixe esses dois permanecerem no valor padrão.

Por fim, temos a opção de selecionar o modelo de idioma.

Se o seu texto estiver em inglês, selecione o primeiro modelo Eleven Monolingual v1. Como alternativa, escolha o modelo Eleven Multilingual v1 para trabalhar com texto em inglês, alemão, polonês, espanhol, italiano, português e hindi.

3. Digite o texto e gere fala

Agora que você selecionou as configurações de voz e modelo, resta apenas transferir o texto para o campo Texto.

Em seguida, clique em Gerar .

Seu texto agora será lido em voz alta. Percorra o texto conforme ele está sendo falado para determinar se ele precisa de alguma alteração.

Desenhe uma nova voz

As vozes pré-fabricadas são mais do que suficientes para você começar. Mas se eles não funcionarem para você, você mesmo pode criar uma nova voz. Para isso, primeiro clique em VoiceLab na parte superior.

Em seguida, clique em Adicionar voz generativa ou clonada .

Para usuários gratuitos, apenas a opção Voice Design estará disponível.

Na janela de criação de voz, selecione Sexo, Idade, Sotaque e Força do Sotaque e clique em Gerar para ouvi-la.

Se gostar, clique em Usar Voz .

Dê um nome à voz e selecione Criar voz .

Baixe suas amostras de conversão de texto em fala geradas

O ElevenLabs, além de permitir que você gere fala a partir de texto, também permite que você baixe a fala gerada como arquivos MP3. Para fazer isso, clique em Histórico na parte superior.

Aqui, você encontrará a lista completa de seu conteúdo de fala gerado. Selecione aquele que deseja baixar.

Em seguida, clique em Baixar selecionados .

E assim, sua amostra de conversão de texto em fala gerada será baixada.

Faça mais com ElevenLabs

O plano gratuito do ElevenLabs permite converter texto em fala para cerca de 10.000 caracteres por mês e criar três novas vozes. Mas com seus planos pagos, você pode fazer muito mais.

Por US$ 5 por mês, o pacote Starter permite criar 10 vozes personalizadas, clonar sua voz e converter até 30.000 caracteres de texto por mês.

Por US $ 22 por mês, o pacote Creator permite criar 30 vozes personalizadas, clonar sua própria voz, converter até 100.000 caracteres por mês e baixar arquivos de áudio de alta qualidade.

Para recursos adicionais e cotas de personagens mais liberais, você pode se beneficiar do Independent Publisher ($ 99 por mês) ou do plano Growing Business ($ 330 por mês).

Perguntas frequentes

Vamos dar uma olhada em algumas perguntas frequentes sobre o ElevenLabs.

Os personagens não utilizados acumulam para o próximo mês?

Não, os personagens não utilizados não acumulam no próximo mês e os personagens são redefinidos no início de um novo mês.

Quantos caracteres de texto posso converter em fala por vez?

Em uma única solicitação, os usuários gratuitos podem converter 2.500 caracteres de texto. Os usuários inscritos em planos pagos podem converter até 5.000 caracteres por solicitação.

Posso converter texto em outros idiomas além do inglês?

Sim, você pode converter texto em inglês, alemão, polonês, espanhol, italiano, francês, português e hindi. No entanto, com exceção do inglês, isso só é possível com planos pagos.

O conversor de texto para fala AI da ElevenLabs é facilmente uma das melhores ferramentas do mercado hoje para ajudá-lo a ouvir documentos de texto e como eles soam. Para autores e editores, este é um sonho tornado realidade. Mas mesmo para amadores ou criadores de conteúdo que procuram narração humana, o ElevenLabs é uma ferramenta ideal para trabalhar. Esperamos que este guia tenha ajudado você a converter texto em fala para seus documentos. Até a próxima vez!

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *