Saltar al contenido principal

Perfiles de Voz

Los perfiles de voz conectan las voces de ElevenLabs al sistema de locución. Cada perfil envuelve una voz de ElevenLabs con parámetros de ajuste que controlan cómo suena el habla sintetizada. Los perfiles de voz son referenciados por las plantillas de los Paquetes de Locución para determinar qué voz entrega cada anuncio.

Ruta del backoffice: backoffice/voice-profiles

Disponible para roles: Administrador del Sistema, Administrador

Crear un Perfil de Voz

Cuando abre la página de creación, el sistema obtiene la lista de voces disponibles de la API de ElevenLabs. Cada voz se presenta con:

  • Audio de vista previa -- una muestra corta que puede reproducir para escuchar la voz
  • Etiquetas -- etiquetas de metadatos como acento (por ejemplo, "Británico", "Americano"), edad (por ejemplo, "joven", "mediana edad") y estilo (por ejemplo, "narrativo", "conversacional")

Seleccione una voz para completar el perfil. El campo de nombre se completa automáticamente desde el nombre de la voz de ElevenLabs, pero puede cambiarlo.

Campos

CampoDescripciónPredeterminado / Rango
NombreNombre de visualización del perfilCompletado automáticamente desde el nombre de la voz de ElevenLabs
ID de Voz ElevenLabsLa voz seleccionada de la API de ElevenLabsSeleccionada durante la creación
ID de Modelo ElevenLabsEl modelo TTS a utilizareleven_turbo_v2_5
Idioma de LocuciónIdioma de Locución predeterminado para la pronunciación de dígitos y saludosObligatorio
EstabilidadControla la consistencia de la voz entre generaciones. Valores más bajos producen una salida más expresiva y variada; valores más altos producen una salida más predecibleValores discretos: 0.0, 0.5 o 1.0 (para modelo v3)
Impulso de SimilitudQué tan cercanamente la salida coincide con la muestra de voz original. Valores más altos aumentan la fidelidad pero pueden amplificar artefactos0.0 a 1.0
EstiloControla la expresividad y rango emocional de la voz0.0 a 1.0
VelocidadMultiplicador de velocidad de reproducción para el audio generado0.7 a 1.2
Usar Impulso de ParlanteInterruptor que mejora la claridad y presencia de la voz a costa de una latencia ligeramente mayorActivado / Desactivado
ActivoInterruptor para habilitar o deshabilitar este perfil de vozActivado / Desactivado

Cantidad de Fragmentos

La vista de lista muestra una cantidad de fragmentos para cada perfil de voz. Esto muestra cuántos archivos de audio en caché (fragmentos de locución) existen actualmente que fueron generados usando esta voz. Esto es útil para comprender qué voces están activamente en uso y cuánto contenido en caché depende de cada perfil.

Guía de Ajuste

  • Estabilidad en 0.5 es un buen punto de partida para la mayoría de los casos de uso de anuncios de cabina — equilibra la variación natural con la consistencia.
  • Impulso de Similitud por encima de 0.75 produce reproducciones muy cercanas de la voz original pero puede introducir artefactos de audio si la muestra de voz original es de baja calidad.
  • Estilo en 0.0 produce una entrega neutral y plana. Valores alrededor de 0.3 a 0.5 agregan inflexión natural adecuada para anuncios de PA sin sonar excesivamente dramáticos.
  • Velocidad en 1.0 es el ritmo normal. Reduzca a 0.85 - 0.9 para una sensación de anuncio de cabina más calmada y mesurada. Los valores por debajo de 0.7 o por encima de 1.2 no son compatibles.
  • Habilite Impulso de Parlante para voces que suenan demasiado silenciosas o carecen de presencia en la mezcla, especialmente cuando se aplica el efecto de micrófono de PA en los paquetes de locución.

Notas de Uso

  • Un perfil de voz debe estar activo para ser usado por las plantillas de paquetes de locución. Desactivar un perfil no elimina los fragmentos en caché, pero no se generará nuevo audio con esa voz hasta que se reactive.
  • Cada perfil de voz está vinculado a un solo idioma de locución por defecto. Las plantillas individuales de paquetes de locución pueden anular este idioma si es necesario (por ejemplo, un perfil de voz alemán utilizado para un anuncio en idioma inglés).
  • Cambiar los parámetros de ajuste (estabilidad, impulso de similitud, estilo, velocidad) no regenera automáticamente los fragmentos en caché existentes. Los nuevos fragmentos utilizarán las configuraciones actualizadas, pero el audio previamente en caché permanece sin cambios hasta que el texto subyacente cambie.
  • No puede eliminar un perfil de voz que tenga fragmentos en caché en uso. Desactívelo en su lugar si desea retirar una voz.