Perfiles de Voz

Los perfiles de voz conectan las voces de ElevenLabs al sistema de locución. Cada perfil envuelve una voz de ElevenLabs con parámetros de ajuste que controlan cómo suena el habla sintetizada. Los perfiles de voz son referenciados por las plantillas de los Paquetes de Locución para determinar qué voz entrega cada anuncio.

Ruta del backoffice: backoffice/voice-profiles

Disponible para roles: Administrador del Sistema, Administrador

Crear un Perfil de Voz

Cuando abre la página de creación, el sistema obtiene la lista de voces disponibles de la API de ElevenLabs. Cada voz se presenta con:

Audio de vista previa -- una muestra corta que puede reproducir para escuchar la voz
Etiquetas -- etiquetas de metadatos como acento (por ejemplo, "Británico", "Americano"), edad (por ejemplo, "joven", "mediana edad") y estilo (por ejemplo, "narrativo", "conversacional")

Seleccione una voz para completar el perfil. El campo de nombre se completa automáticamente desde el nombre de la voz de ElevenLabs, pero puede cambiarlo.

Campos

Campo	Descripción	Predeterminado / Rango
Nombre	Nombre de visualización del perfil	Completado automáticamente desde el nombre de la voz de ElevenLabs
ID de Voz ElevenLabs	La voz seleccionada de la API de ElevenLabs	Seleccionada durante la creación
ID de Modelo ElevenLabs	El modelo TTS a utilizar	`eleven_turbo_v2_5`
Idioma de Locución	Idioma de Locución predeterminado para la pronunciación de dígitos y saludos	Obligatorio
Estabilidad	Controla la consistencia de la voz entre generaciones. Valores más bajos producen una salida más expresiva y variada; valores más altos producen una salida más predecible	Valores discretos: `0.0`, `0.5` o `1.0` (para modelo v3)
Impulso de Similitud	Qué tan cercanamente la salida coincide con la muestra de voz original. Valores más altos aumentan la fidelidad pero pueden amplificar artefactos	`0.0` a `1.0`
Estilo	Controla la expresividad y rango emocional de la voz	`0.0` a `1.0`
Velocidad	Multiplicador de velocidad de reproducción para el audio generado	`0.7` a `1.2`
Usar Impulso de Parlante	Interruptor que mejora la claridad y presencia de la voz a costa de una latencia ligeramente mayor	Activado / Desactivado
Activo	Interruptor para habilitar o deshabilitar este perfil de voz	Activado / Desactivado

Cantidad de Fragmentos

La vista de lista muestra una cantidad de fragmentos para cada perfil de voz. Esto muestra cuántos archivos de audio en caché (fragmentos de locución) existen actualmente que fueron generados usando esta voz. Esto es útil para comprender qué voces están activamente en uso y cuánto contenido en caché depende de cada perfil.

Guía de Ajuste

Estabilidad en 0.5 es un buen punto de partida para la mayoría de los casos de uso de anuncios de cabina — equilibra la variación natural con la consistencia.
Impulso de Similitud por encima de 0.75 produce reproducciones muy cercanas de la voz original pero puede introducir artefactos de audio si la muestra de voz original es de baja calidad.
Estilo en 0.0 produce una entrega neutral y plana. Valores alrededor de 0.3 a 0.5 agregan inflexión natural adecuada para anuncios de PA sin sonar excesivamente dramáticos.
Velocidad en 1.0 es el ritmo normal. Reduzca a 0.85 - 0.9 para una sensación de anuncio de cabina más calmada y mesurada. Los valores por debajo de 0.7 o por encima de 1.2 no son compatibles.
Habilite Impulso de Parlante para voces que suenan demasiado silenciosas o carecen de presencia en la mezcla, especialmente cuando se aplica el efecto de micrófono de PA en los paquetes de locución.

Notas de Uso

Un perfil de voz debe estar activo para ser usado por las plantillas de paquetes de locución. Desactivar un perfil no elimina los fragmentos en caché, pero no se generará nuevo audio con esa voz hasta que se reactive.
Cada perfil de voz está vinculado a un solo idioma de locución por defecto. Las plantillas individuales de paquetes de locución pueden anular este idioma si es necesario (por ejemplo, un perfil de voz alemán utilizado para un anuncio en idioma inglés).
Cambiar los parámetros de ajuste (estabilidad, impulso de similitud, estilo, velocidad) no regenera automáticamente los fragmentos en caché existentes. Los nuevos fragmentos utilizarán las configuraciones actualizadas, pero el audio previamente en caché permanece sin cambios hasta que el texto subyacente cambie.
No puede eliminar un perfil de voz que tenga fragmentos en caché en uso. Desactívelo en su lugar si desea retirar una voz.

Crear un Perfil de Voz​

Campos​

Cantidad de Fragmentos​

Guía de Ajuste​

Notas de Uso​

Crear un Perfil de Voz

Campos

Cantidad de Fragmentos

Guía de Ajuste

Notas de Uso