Perfis de Voz
Perfis de voz conectam vozes do ElevenLabs ao sistema de fala. Cada perfil envolve uma voz do ElevenLabs com parâmetros de ajuste que controlam como a fala sintetizada soa. Perfis de voz são referenciados por templates de Pacotes de Fala para determinar qual voz entrega cada anúncio.
Caminho no backoffice: backoffice/voice-profiles
Disponível para funções: Administrador do Sistema, Administrador
Criando um Perfil de Voz
Quando você abre a página de criação, o sistema busca a lista de vozes disponíveis da API do ElevenLabs. Cada voz é apresentada com:
- Áudio de prévia -- uma amostra curta que você pode reproduzir para ouvir a voz
- Rótulos -- tags de metadados como sotaque (ex.: "Britânico", "Americano"), idade (ex.: "jovem", "meia-idade") e estilo (ex.: "narrativo", "conversacional")
Selecione uma voz para preencher o perfil. O campo nome é preenchido automaticamente a partir do nome da voz do ElevenLabs, mas você pode alterá-lo.
Campos
| Campo | Descrição | Padrão / Intervalo |
|---|---|---|
| Nome | Nome de exibição do perfil | Preenchido automaticamente a partir do nome da voz ElevenLabs |
| ID de Voz ElevenLabs | A voz selecionada da API do ElevenLabs | Selecionada durante a criação |
| ID de Modelo ElevenLabs | O modelo TTS a ser usado | eleven_turbo_v2_5 |
| Idioma de Fala | Idioma de Fala padrão para pronúncia de dígitos e saudações | Obrigatório |
| Estabilidade | Controla a consistência da voz entre gerações. Valores mais baixos produzem saída mais expressiva e variada; valores mais altos produzem saída mais previsível | Valores discretos: 0.0, 0.5 ou 1.0 (para modelo v3) |
| Impulso de Similaridade | Quão próxima a saída corresponde à amostra de voz original. Valores mais altos aumentam a fidelidade, mas podem amplificar artefatos | 0.0 a 1.0 |
| Estilo | Controla a expressividade e o alcance emocional da voz | 0.0 a 1.0 |
| Velocidade | Multiplicador de velocidade de reprodução para o áudio gerado | 0.7 a 1.2 |
| Usar Impulso de Alto-Falante | Indicador que melhora a clareza e presença da voz ao custo de latência ligeiramente maior | Ligado / Desligado |
| Ativo | Indicador para habilitar ou desabilitar este perfil de voz | Ligado / Desligado |
Contagem de Fragmentos
A visualização de lista exibe uma contagem de fragmentos para cada perfil de voz. Isso mostra quantos arquivos de áudio em cache (fragmentos de fala) atualmente existem que foram gerados usando esta voz. Isso é útil para entender quais vozes estão ativamente em uso e quanto conteúdo em cache depende de cada perfil.
Diretrizes de Ajuste
- Estabilidade em 0.5 é um bom ponto de partida para a maioria dos casos de uso de anúncios de cabine -- equilibra variação natural com consistência.
- Impulso de Similaridade acima de
0.75produz reproduções muito fiéis da voz original, mas pode introduzir artefatos de áudio se a amostra de voz fonte for de baixa qualidade. - Estilo em
0.0produz entrega neutra e plana. Valores em torno de0.3a0.5adicionam inflexão natural adequada para anúncios PA sem soar excessivamente dramático. - Velocidade em
1.0é o ritmo normal. Reduza para0.85-0.9para uma sensação mais calma e medida de anúncio de cabine. Valores abaixo de0.7ou acima de1.2não são suportados. - Habilite o Impulso de Alto-Falante para vozes que soam muito baixas ou sem presença na mistura, especialmente quando o efeito de microfone PA é aplicado nos pacotes de fala.
Notas de Uso
- Um perfil de voz deve estar ativo para ser usado por templates de pacotes de fala. Desativar um perfil não exclui fragmentos em cache, mas novo áudio não será gerado com essa voz até que seja reativado.
- Cada perfil de voz está vinculado a um único idioma de fala por padrão. Templates individuais de pacotes de fala podem substituir este idioma se necessário (ex.: um perfil de voz alemão usado para um anúncio em inglês).
- Alterar parâmetros de ajuste (estabilidade, impulso de similaridade, estilo, velocidade) não regenera automaticamente fragmentos em cache existentes. Novos fragmentos usarão as configurações atualizadas, mas áudio previamente em cache permanece inalterado até que o texto subjacente mude.
- Você não pode excluir um perfil de voz que tem fragmentos em cache em uso. Desative-o em vez disso se quiser aposentar uma voz.