Pular para o conteúdo principal

Perfis de Voz

Perfis de voz conectam vozes do ElevenLabs ao sistema de fala. Cada perfil envolve uma voz do ElevenLabs com parâmetros de ajuste que controlam como a fala sintetizada soa. Perfis de voz são referenciados por templates de Pacotes de Fala para determinar qual voz entrega cada anúncio.

Caminho no backoffice: backoffice/voice-profiles

Disponível para funções: Administrador do Sistema, Administrador

Criando um Perfil de Voz

Quando você abre a página de criação, o sistema busca a lista de vozes disponíveis da API do ElevenLabs. Cada voz é apresentada com:

  • Áudio de prévia -- uma amostra curta que você pode reproduzir para ouvir a voz
  • Rótulos -- tags de metadados como sotaque (ex.: "Britânico", "Americano"), idade (ex.: "jovem", "meia-idade") e estilo (ex.: "narrativo", "conversacional")

Selecione uma voz para preencher o perfil. O campo nome é preenchido automaticamente a partir do nome da voz do ElevenLabs, mas você pode alterá-lo.

Campos

CampoDescriçãoPadrão / Intervalo
NomeNome de exibição do perfilPreenchido automaticamente a partir do nome da voz ElevenLabs
ID de Voz ElevenLabsA voz selecionada da API do ElevenLabsSelecionada durante a criação
ID de Modelo ElevenLabsO modelo TTS a ser usadoeleven_turbo_v2_5
Idioma de FalaIdioma de Fala padrão para pronúncia de dígitos e saudaçõesObrigatório
EstabilidadeControla a consistência da voz entre gerações. Valores mais baixos produzem saída mais expressiva e variada; valores mais altos produzem saída mais previsívelValores discretos: 0.0, 0.5 ou 1.0 (para modelo v3)
Impulso de SimilaridadeQuão próxima a saída corresponde à amostra de voz original. Valores mais altos aumentam a fidelidade, mas podem amplificar artefatos0.0 a 1.0
EstiloControla a expressividade e o alcance emocional da voz0.0 a 1.0
VelocidadeMultiplicador de velocidade de reprodução para o áudio gerado0.7 a 1.2
Usar Impulso de Alto-FalanteIndicador que melhora a clareza e presença da voz ao custo de latência ligeiramente maiorLigado / Desligado
AtivoIndicador para habilitar ou desabilitar este perfil de vozLigado / Desligado

Contagem de Fragmentos

A visualização de lista exibe uma contagem de fragmentos para cada perfil de voz. Isso mostra quantos arquivos de áudio em cache (fragmentos de fala) atualmente existem que foram gerados usando esta voz. Isso é útil para entender quais vozes estão ativamente em uso e quanto conteúdo em cache depende de cada perfil.

Diretrizes de Ajuste

  • Estabilidade em 0.5 é um bom ponto de partida para a maioria dos casos de uso de anúncios de cabine -- equilibra variação natural com consistência.
  • Impulso de Similaridade acima de 0.75 produz reproduções muito fiéis da voz original, mas pode introduzir artefatos de áudio se a amostra de voz fonte for de baixa qualidade.
  • Estilo em 0.0 produz entrega neutra e plana. Valores em torno de 0.3 a 0.5 adicionam inflexão natural adequada para anúncios PA sem soar excessivamente dramático.
  • Velocidade em 1.0 é o ritmo normal. Reduza para 0.85 - 0.9 para uma sensação mais calma e medida de anúncio de cabine. Valores abaixo de 0.7 ou acima de 1.2 não são suportados.
  • Habilite o Impulso de Alto-Falante para vozes que soam muito baixas ou sem presença na mistura, especialmente quando o efeito de microfone PA é aplicado nos pacotes de fala.

Notas de Uso

  • Um perfil de voz deve estar ativo para ser usado por templates de pacotes de fala. Desativar um perfil não exclui fragmentos em cache, mas novo áudio não será gerado com essa voz até que seja reativado.
  • Cada perfil de voz está vinculado a um único idioma de fala por padrão. Templates individuais de pacotes de fala podem substituir este idioma se necessário (ex.: um perfil de voz alemão usado para um anúncio em inglês).
  • Alterar parâmetros de ajuste (estabilidade, impulso de similaridade, estilo, velocidade) não regenera automaticamente fragmentos em cache existentes. Novos fragmentos usarão as configurações atualizadas, mas áudio previamente em cache permanece inalterado até que o texto subjacente mude.
  • Você não pode excluir um perfil de voz que tem fragmentos em cache em uso. Desative-o em vez disso se quiser aposentar uma voz.