Perfiles de Voz
Los perfiles de voz conectan las voces de ElevenLabs al sistema de locución. Cada perfil envuelve una voz de ElevenLabs con parámetros de ajuste que controlan cómo suena el habla sintetizada. Los perfiles de voz son referenciados por las plantillas de los Paquetes de Locución para determinar qué voz entrega cada anuncio.
Ruta del backoffice: backoffice/voice-profiles
Disponible para roles: Administrador del Sistema, Administrador
Crear un Perfil de Voz
Cuando abre la página de creación, el sistema obtiene la lista de voces disponibles de la API de ElevenLabs. Cada voz se presenta con:
- Audio de vista previa -- una muestra corta que puede reproducir para escuchar la voz
- Etiquetas -- etiquetas de metadatos como acento (por ejemplo, "Británico", "Americano"), edad (por ejemplo, "joven", "mediana edad") y estilo (por ejemplo, "narrativo", "conversacional")
Seleccione una voz para completar el perfil. El campo de nombre se completa automáticamente desde el nombre de la voz de ElevenLabs, pero puede cambiarlo.
Campos
| Campo | Descripción | Predeterminado / Rango |
|---|---|---|
| Nombre | Nombre de visualización del perfil | Completado automáticamente desde el nombre de la voz de ElevenLabs |
| ID de Voz ElevenLabs | La voz seleccionada de la API de ElevenLabs | Seleccionada durante la creación |
| ID de Modelo ElevenLabs | El modelo TTS a utilizar | eleven_turbo_v2_5 |
| Idioma de Locución | Idioma de Locución predeterminado para la pronunciación de dígitos y saludos | Obligatorio |
| Estabilidad | Controla la consistencia de la voz entre generaciones. Valores más bajos producen una salida más expresiva y variada; valores más altos producen una salida más predecible | Valores discretos: 0.0, 0.5 o 1.0 (para modelo v3) |
| Impulso de Similitud | Qué tan cercanamente la salida coincide con la muestra de voz original. Valores más altos aumentan la fidelidad pero pueden amplificar artefactos | 0.0 a 1.0 |
| Estilo | Controla la expresividad y rango emocional de la voz | 0.0 a 1.0 |
| Velocidad | Multiplicador de velocidad de reproducción para el audio generado | 0.7 a 1.2 |
| Usar Impulso de Parlante | Interruptor que mejora la claridad y presencia de la voz a costa de una latencia ligeramente mayor | Activado / Desactivado |
| Activo | Interruptor para habilitar o deshabilitar este perfil de voz | Activado / Desactivado |
Cantidad de Fragmentos
La vista de lista muestra una cantidad de fragmentos para cada perfil de voz. Esto muestra cuántos archivos de audio en caché (fragmentos de locución) existen actualmente que fueron generados usando esta voz. Esto es útil para comprender qué voces están activamente en uso y cuánto contenido en caché depende de cada perfil.
Guía de Ajuste
- Estabilidad en 0.5 es un buen punto de partida para la mayoría de los casos de uso de anuncios de cabina — equilibra la variación natural con la consistencia.
- Impulso de Similitud por encima de
0.75produce reproducciones muy cercanas de la voz original pero puede introducir artefactos de audio si la muestra de voz original es de baja calidad. - Estilo en
0.0produce una entrega neutral y plana. Valores alrededor de0.3a0.5agregan inflexión natural adecuada para anuncios de PA sin sonar excesivamente dramáticos. - Velocidad en
1.0es el ritmo normal. Reduzca a0.85-0.9para una sensación de anuncio de cabina más calmada y mesurada. Los valores por debajo de0.7o por encima de1.2no son compatibles. - Habilite Impulso de Parlante para voces que suenan demasiado silenciosas o carecen de presencia en la mezcla, especialmente cuando se aplica el efecto de micrófono de PA en los paquetes de locución.
Notas de Uso
- Un perfil de voz debe estar activo para ser usado por las plantillas de paquetes de locución. Desactivar un perfil no elimina los fragmentos en caché, pero no se generará nuevo audio con esa voz hasta que se reactive.
- Cada perfil de voz está vinculado a un solo idioma de locución por defecto. Las plantillas individuales de paquetes de locución pueden anular este idioma si es necesario (por ejemplo, un perfil de voz alemán utilizado para un anuncio en idioma inglés).
- Cambiar los parámetros de ajuste (estabilidad, impulso de similitud, estilo, velocidad) no regenera automáticamente los fragmentos en caché existentes. Los nuevos fragmentos utilizarán las configuraciones actualizadas, pero el audio previamente en caché permanece sin cambios hasta que el texto subyacente cambie.
- No puede eliminar un perfil de voz que tenga fragmentos en caché en uso. Desactívelo en su lugar si desea retirar una voz.