Voice cloning
trente langues, une voix.

VoxCPM2 par OpenBMB · clonage vocal 30 langues sur GPU. Fallback Edge-TTS local quand le GPU n'est pas dispo. Production-ready pour podcasts, assistants vocaux, accessibilité.

ProviderVoxCPM2 (OpenBMB)
GPU · fallback Edge-TTS
Coût0 €
open-source · MIT
Latence3 à 8 s
GPU · ~10 s sans GPU
Endpoint/api/ambre-tool-voxcpm.php
POST action=clone

Capacités VoxCPM

OpenBMB · GPU cascade · 30 langues
🌐
Trente langues
Couverture mondiale étendue VoxCPM2.
🎯
Voice clone court
Clone depuis 3-5 sec audio source. Précision élevée.
GPU accéléré
RunPod A5000 wake-able. Fallback Edge-TTS si GPU absent.
📞
Production ready
Podcasts, IVR, accessibilité, narration livre audio.

Clonez une voix

POST /api/ambre-tool-voxcpm.php
🎬 Narration📞 Message vocal🎓 Cours en ligne🌃 Audiobook
Prêt · fournissez du texte ou cliquez un exemple

Résultat

Pipeline technique

cascade souveraine
# 1. POST endpoint VoxCPM
POST /api/ambre-tool-voxcpm.php
  Body: {{ "action": "clone", "text": "...", "voice_ref": "..." }}

# 2. Cascade GPU → Edge-TTS
 Try GPU (RunPod RTX A5000 si réveillé)   ~3-5 s
 Fallback Edge-TTS local                  ~10 s · neural standard

# 3. Réponse
{{
  "ok": true,
  "provider": "voxcpm2-gpu" ou "edge-tts-fallback",
  "audio_url": "/api/audio/voxcpm-{{ts}}.wav"
}}