Instrumente media
Generează imagini și videoclipuri cu peste 40 de modele AI. Apelează întotdeauna get_models mai întâi pentru a vedea modelele disponibile, costurile și dacă un model necesită o imagine de intrare.
#generate_media
Pornește o generare de imagine sau video.
Parametri:
| Parametru | Tip | Obligatoriu | Descriere |
|---|---|---|---|
| prompt | string | Da | Ce să genereze (ex. „Mașină roșie pe un drum de munte”). |
| model | string | Da | ID model (de la get_models). Exemple: nano-banana, sora-2, kling-2-6-image-to-video. |
| generation_type | string | Nu | text-to-image, text-to-video, image-to-video sau image-to-image. Implicit: text-to-image. |
| negative_prompt | string | Nu | Ce să evite în output. |
| source_media_urls | string sau array | Nu | Obligatoriu pentru image-to-video și image-to-image. URL-uri către imagine(i), sau pentru unele modele (ex. Kling 2.6 Motion) imagine + video. Vezi limitele de intrare mai jos. Omitere pentru text-to-image și text-to-video. |
| aspect_ratio | string | Nu | ex. 1:1, 16:9, 9:16, 4:5, 21:9. Implicit: 1:1. |
| duration | string | Nu | Durata video. Doar anumite modele video o folosesc. Vezi mai jos. |
| quality | string | Nu | ex. fast, standard, pro, ultra. Implicit: standard. |
| sound | boolean | Nu | Când true, solicită video cu audio generat. Doar anumite modele video. Implicit: false. Vezi mai jos. |
| seed | number | Nu | Seed pentru rezultate reproductibile. |
Exemplu (text-to-image):
{
"prompt": "Un oraș futurist la apus cu mașini zburătoare",
"model": "nano-banana",
"generation_type": "text-to-image",
"aspect_ratio": "16:9",
"quality": "pro"
}
Exemplu (image-to-video, o imagine de intrare):
{
"prompt": "Mișcare blândă și subtilă",
"model": "kling-2-6-image-to-video",
"generation_type": "image-to-video",
"source_media_urls": ["https://example.com/your-image.jpg"],
"aspect_ratio": "16:9",
"duration": "5s"
}
Răspuns: Include generation_id, status (ex. pending) și adesea estimated_time_seconds și estimated_cost_credits. Interoghează cu get_generation_status până când status este completed sau failed.
Modele care suportă duration:
| Model(e) | Valori suportate | Observații |
|---|---|---|
| kling-2-6-text-to-video, kling-2-6-image-to-video | 5s, 10s | Opțional cu/fără audio (variantă model). |
| wan-2-5 (text-to-video, image-to-video) | 5s, 10s | |
| v1-pro-fast-i2v | 5s, 10s | |
| seedance-1-5-pro | 4s, 8s, 12s | Suportă text-to-video (0–1 imagine opțional) și image-to-video (2 imagini obligatorii). |
| sora-2, sora-2-pro (text-to-video, image-to-video) | 10s, 15s | |
| sora-2-pro-storyboard | 10s, 15s, 25s | Bazat pe scene; durata din planuri. |
| grok-text-to-video-6s | 6s fix | Parametrul duration este ignorat. |
| grok-image-to-video, kling-2-5-image-to-video-pro, veo3-1 | Neconfigurabil | Durata nu se setează prin acest parametru. |
Pentru modele doar imagine, duration este ignorat.
Modele care suportă negative_prompt:
| Model(e) | Observații |
|---|---|
| imagen-4, imagen-4-fast, imagen-4-ultra | Text-to-image. |
| wan-2-5 (text-to-video, image-to-video) | |
| kling-2-5-image-to-video-pro |
Celelalte modele ignoră negative_prompt.
Modele care suportă quality (sau echivalent):
| Model(e) | Cum funcționează | Valori |
|---|---|---|
| sora-2-pro (text-to-video, image-to-video) | Mapat la size (standard vs HD). | standard, pro/high/hd (pentru HD). |
| imagen-4 variante | Mapat la model_variant. | standard, fast, ultra (folosește quality: standard / fast / ultra). |
| seedream-v4-5-edit (și seedream v4.5 text-to-image) | Folosește quality direct. | ex. basic și alte valori API. |
| veo3-1 vs veo3-1-fast | ID-uri de model diferite, nu un singur parametru quality. | Folosește model veo3-1 (calitate) sau veo3-1-fast (viteză). |
| flux-2, nano-banana-pro, nano-banana-2 | Rezoluție (1K/2K/4K), nu un string generic „quality”. | Folosește varianta de model sau parametrul de rezoluție când e disponibil. |
Pentru celelalte modele, quality este ignorat.
Limite caractere prompt:
Unele modele impun o lungime maximă a promptului. Depășirea poate returna eroare sau truncare.
| Model(e) | Caractere max |
|---|---|
| wan-2-5 | 800 |
| kling-2-6 (text-to-video, image-to-video) | 2.500 |
| kling-2-5-image-to-video-pro | 2.500 |
| seedream-v4, seedream-v4-edit | 2.500 |
| seedream-v4-5, seedream-v4-5-edit | 3.000 |
| gpt-1.5-image-medium, gpt-1.5-image-high | 3.000 |
| nano-banana, imagen-4, sora-2, flux-2, veo3-1, v1-pro-fast-i2v, grok (image/video) | 5.000 |
| nano-banana-pro (toate variantele) | 20.000 |
| nano-banana-2 (toate variantele) | 20.000 |
Altele pot să nu aibă limită documentată sau să folosească valorile implicite ale serverului.
Limite fișiere de intrare (imagini și video):
Pentru image-to-video și image-to-image, source_media_urls este o listă de URL-uri. Majoritatea modelelor acceptă doar imagini (JPEG, PNG, WebP, de obicei 10 MB max per fișier). Unele modele acceptă și intrări video; când acceptă, se aplică limite de format și mărime (ex. MP4, durată max).
| Model(e) | Tip intrare | Limită | Observații |
|---|---|---|---|
| kling-2-6-motion-control-720p, kling-2-6-motion-control-1080p | Imagine + video | 1 imagine + 1 video | Motion Control: video-ul de referință conduce mișcarea. Video max 30 s; fișier video de obicei până la 100 MB (MP4/WebM). |
| kling-3-0-motion-control-720p, kling-3-0-motion-control-1080p | Imagine + video | 1 imagine + 1 video | Kling 3.0 Motion Control: la fel ca Kling 2.6. 24 credite/s (720p), 32 credite/s (1080p). Video max 30 s; fișier video de obicei până la 100 MB (MP4/WebM). |
| kling-2-6-image-to-video, sora-2 (image-to-video), wan-2-5 (image-to-video), grok-image-to-video, v1-pro-fast-i2v | Doar imagini | 1 imagine | Exact o imagine de intrare. |
| kling-2-5-image-to-video-pro | Doar imagini | 2 imagini | Cadru inițial și final. |
| kling-3-0-std, kling-3-0-pro | Doar imagini | 1–2 imagini | Cadru start, sau start + final. PNG/JPG/JPEG. Suportă elemente (vezi mai jos). |
| seedance-1-5-pro | Doar imagini | Depinde de mod | Text-to-video (generation_type: "text-to-video"): 0–1 imagini opționale. Image-to-video (generation_type: "image-to-video"): exact 2 imagini obligatorii (cadru start + final). |
| seedream-v4-edit | Doar imagini | 10 | Pentru editare. |
| nano-banana, nano-banana-edit | Doar imagini | 10 | |
| nano-banana-pro (toate variantele) | Doar imagini | 8 | |
| nano-banana-2 (toate variantele) | Doar imagini | 8 | |
| flux-2-edit (image-to-image) | Doar imagini | 8 | |
| gpt-1.5-image (image-to-image) | Doar imagini | 16 | |
| veo3-1 (image-to-video / moduri referință) | Doar imagini | 1-3 | Depinde de mod (1 referință opțională text-to-video; 2 cadru inițial+final; 3 referință). |
| sora-2-pro-storyboard | Doar imagini | 1 | Opțional. |
Folosește get_models pentru a confirma input_media_types și capabilitățile pentru un model dat. Vezi Instrumente cont pentru listă modele și prețuri.
Kling 3.0 – elemente (opțional):
Elementele permit referențierea imaginilor sau videoclipurilor în prompt cu @element_name. Trimite kling_elements ca array de obiecte cu name, description și fie element_input_urls (2–4 URL-uri imagine) fie element_input_video_urls (1 URL video). Elementele pot fi folosite doar când ai cel puțin 1 imagine: text-to-video + 1 imagine, sau image-to-video cu cadru inițial și final. Fiecare element necesită titlu (name) și descriere. Imagini element: JPG/PNG, min 300×300px, max 10MB fiecare. Video element: MP4/MOV, max 50MB.
Seedance 1.5 Pro – două moduri (verifică generation_type înainte de a folosi imagini):
| Mod | generation_type | source_media_urls | Poate folosi imagini? |
|---|---|---|---|
| Text-to-video | "text-to-video" | Gol sau 1 URL | Opțional: 0–1 imagini. Omite pentru doar text; include 1 URL pentru a anima acea imagine. |
| Image-to-video | "image-to-video" | Exact 2 URL-uri | Obligatoriu: exact 2 imagini (cadru start + cadru final). |
Modele care suportă audio (parametrul sound):
| Model(e) | Observații |
|---|---|
| kling-2-6-text-to-video, kling-2-6-image-to-video | Setează sound: true pentru video cu audio generat. Prețuri diferite pentru variantele cu/fără audio. |
| kling-3-0-std, kling-3-0-pro | Setează sound: true pentru audio generat. |
| seedance-1-5-pro | Setează sound: true pentru audio generat. Suportă atât text-to-video cât și image-to-video. |
Celelalte modele video nu suportă parametrul sound. Modelele doar imagine ignoră sound.
#get_generation_status
Verifică statusul unei generări media și obține URL-urile de output când e gata.
Parametri:
| Parametru | Tip | Obligatoriu | Descriere |
|---|---|---|---|
| generation_id | string | Da | ID returnat de generate_media. |
Răspuns: Include status (pending, queued, processing, completed, failed), progress și când e finalizat un array outputs cu url, thumbnail_url, optimized_url, media_type, dimensiuni etc.
#get_generation_estimate
Obține un timp estimat de procesare în funcție de parametri pentru un model și opțiuni dat (nu se pornește niciun job). Pentru o durată estimată per model într-un singur apel, folosește get_models; fiecare model include estimated_time_seconds. Folosește get_generation_estimate când ai nevoie de o estimare care depinde de lungimea promptului, durată sau alți parametri.
Parametri:
| Parametru | Tip | Obligatoriu | Descriere |
|---|---|---|---|
| model | string | Da | ID model. |
| generation_type | string | Nu | La fel ca în generate_media. Implicit: text-to-image. |
| prompt | string | Nu | Opțional; poate afecta estimarea. |
| negative_prompt | string | Nu | Opțional. |
| parameters | object | Nu | Parametri suplimentari opționali. |
Răspuns: Timp estimat (și opțional încredere/dimensiune eșantion) pentru a seta așteptările utilizatorului înainte de generate_media.
#Reguli modele
- Text-to-image și text-to-video: Nu trimite
source_media_urls(decât dacă modelul suportă o imagine de referință opțională). Excepție: seedance-1-5-pro în mod text-to-video acceptă 0–1 imagini opționale. - Image-to-video și image-to-image: Trimite URL-uri imagine (și când e suportat, video) în
source_media_urls. Majoritatea modelelor au nevoie doar de imagini; unele (ex. Kling 2.6 Motion Control) necesită 1 imagine + 1 video. seedance-1-5-pro în mod image-to-video necesită exact 2 imagini (cadru start + final). Respectă limitele de intrare ale fiecărui model de mai sus. - Audio: kling-2-6, kling-3-0 și seedance-1-5-pro suportă
sound: true; celelalte modele ignorăsound. - Folosește get_models pentru a vedea ce modele suportă ce tipuri de generare,
input_media_types(ex. image, video) și numărul necesar de intrări.
Vezi Limitări pentru limite de rată și credite.
