Instrumente dialog
Generați conținut audio TTS cu o singură voce folosind ElevenLabs v3 pe Replicate. Instrumentul generate_dialogue acceptă un singur text și o singură voce per apel — scenele cu mai multe voci se obțin combinând rezultatele mai multor apeluri.
#Voci disponibile
elevenlabs/v3 acceptă aceste 26 de voci (sensibile la majuscule). Orice altă valoare este respinsă cu 400 Unsupported voice și nu se taxează creditele.
#Voci feminine
| ID voce | Descriere | Previzualizare |
|---|---|---|
| Rachel | Americancă, calmă și articulată | |
| Aria | Americancă, expresivă, voce răgușită | |
| Domi | Americancă tânără, puternică, încrezătoare | |
| Sarah | Americancă tânără, blândă și caldă | |
| Jane | Australiancă matură și demnă | |
| Juniper | Americancă, naturală și articulată | |
| Arabella | Naratoare britanică misterioasă | |
| Hope | Americancă luminoasă și optimistă | |
| Blondie | Americancă, ton conversațional relaxat | |
| Priyanka | Indianică, voce senzuală și liniștitoare | |
| Alexandra | Americancă tânără, conversațională | |
| Monika | Indianică, voce profundă și naturală |
#Voci masculine
| ID voce | Descriere | Previzualizare |
|---|---|---|
| Drew | Narator american echilibrat | |
| Clyde | Personaj veteran de război, voce aspră | |
| Paul | Reporter de teren, ton autoritar | |
| Dave | Britanic tânăr, ton conversațional | |
| Roger | American elegant, ton de business | |
| Fin | Personaj de marinar cu accent irlandez | |
| James | Narator australian calm | |
| Bradford | Britanic teatral și articulat | |
| Reginald | Personaj britanic intens și dramatic | |
| Gaming | Personaj de gaming, energic și expresiv | |
| Austin | American country, ton degajat | |
| Kuon | Voce de personaj veselă și constantă | |
| Mark | American, ton casual și relaxat | |
| Grimblewood | Personaj fantasy, voce gravă și răgușită |
Catalogul complet apare și prin get_models — filtrați după model_type: "text-to-dialogue" pentru a inspecta prețuri și capabilități programatic.
#generate_dialogue
Generează un clip TTS cu o singură voce.
Parametri:
| Parametru | Tip | Obligatoriu | Descriere |
|---|---|---|---|
text (sau prompt) | string | Da | 5–5000 caractere după eliminarea etichetelor [bracket]. |
voice | string | Nu | Unul dintre cele 26 de ID-uri de mai sus. Implicit: Rachel. |
stability | number | Nu | 0..1, implicit 0.5. Valori mai mari = mai stabilă, mai mici = mai expresivă. |
similarity_boost | number | Nu | 0..1, implicit 0.75. |
style | number | Nu | 0..1, implicit 0. Exagerare a stilului. |
speed | number | Nu | 0.7..1.2, implicit 1.0. |
previous_text / next_text | string | Nu | Context opțional pentru prozodie consistentă între fragmente. |
language_code | string | Nu | Cod ISO. Implicit en. Unul dintre cele 29 de coduri acceptate: ar, bg, cs, da, de, el, en, es, fi, fil, fr, hi, hr, id, it, ja, ko, ms, nl, pl, pt, ro, ru, sk, sv, ta, tr, uk, zh. Trimite auto pentru a folosi implicit en. |
Etichetele audio precum
[HEY],[laughs],[whispers]sunt eliminate pe server înainte de TTS — modelul nu le rostește și nu le interpretează.
Exemplu:
{
"text": "Bun venit înapoi — ești gata să generezi?",
"voice": "Rachel",
"stability": 0.5,
"language_code": "ro"
}
Răspuns: Întoarce un generation_id. Verificați progresul cu get_generation_status.
#Scene cu mai multe voci
generate_dialogue este monovoce. Pentru un dialog între doi vorbitori, apelați instrumentul o dată per replică (transmițând previous_text / next_text pentru continuitate prosodică) și concatenați apoi fișierele audio rezultate.
#get_generation_status
Folosiți generation_id returnat de generate_dialogue pentru a verifica progresul. Când statusul este completed, URL-ul fișierului audio se află în array-ul outputs (media_type: "audio").
#Credite și limite
- Cost: 26 de credite la fiecare 1000 de caractere (rotunjire: zecimal ≤ 0.3 în jos, > 0.3 în sus).
- Minim: 1 credit pentru orice text nevid.
- Lungime minimă: 5 caractere după eliminarea etichetelor audio.
- Lungime maximă: 5000 de caractere per cerere.
Vedeți Limitări pentru detalii complete.
