API de clonación de voz

Crea voces AI personalizadas a partir de muestras de audio con nuestra API de clonación de voces. Sube audio, clona voces y úsalas en el doblaje de texto a voz o IA.
Clonación de voz
Voces propias
API REST
Voice Cloning Interface
Más de 500.000 usuarios confían en nosotros

Potentes funciones de la API de clonación de voz

Todo lo que necesita para integrar la clonación de voz profesional en sus aplicaciones
Sin límites
Clonación de voz ilimitadaCrea voces personalizadas ilimitadas a partir de muestras de audio. Sube audio en formato MP3, WAV, AAC, M4A o FLAC.
Calidad superior
Audio de alta calidadGenere voz con sonido natural gracias a la avanzada tecnología de IA. Compatible con varios formatos de audio y salida de alta calidad.
Desarrolladores
Fácil integraciónAPI REST sencilla con documentación completa. Integre la clonación de voz en sus aplicaciones con solo unas pocas llamadas a la API.

Flujo de trabajo de la API de clonación de voz

Cree voces personalizadas con unas sencillas llamadas a la API
01

Cargar muestra de audio

Obtén una URL preasignada y sube tu archivo de audio en formatos compatibles como MP3, WAV, AAC, M4A o FLAC.
API Request
curl -X GET "https://dubsmart.ai/api/v1/upload?region=EU&fileExtension=mp3" \
  -H "Authorization: Bearer YOUR_API_KEY"

# Response:
{
  "url": "https://storage.dubsmart.ai/uploads/...",
  "key": "uploads/user_id/filename.mp3"
}

# Upload file
curl -X PUT -T your_audio_file.mp3 "https://storage.dubsmart.ai/uploads/..."
02

Crear voz personalizada

Cree una voz personalizada utilizando la muestra de audio cargada. Proporcione un nombre y la clave del archivo desde el paso de carga.
API Request
curl -X POST "https://dubsmart.ai/api/v1/custom-voices/create" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "name": "My Custom Voice",
    "examplePath": "uploads/user_id/filename.mp3"
  }'

# Response:
{
  "id": "67c123...",
  "name": "My Custom Voice",
  "examplePath": "https://...",
  "createdAt": "2024-01-15T10:30:00Z"
}'
03

Uso en proyectos de doblaje TTS y AI

Utiliza tu identificador de voz personalizado en proyectos TTS y de doblaje AI.
API Request
curl -X POST "https://dubsmart.ai/api/v1/projects/tts" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "title": "My TTS Project",
    "segments": [
      {
        "text": "Hello world!",
        "voice": "67c123...",
        "language": "en"
      }
    ]
  }'

Puntos finales de la API de clonación de voz

Referencia completa de la API con ejemplos para todos los puntos finales
GET
/upload

Obtener la URL del archivo cargado

Obtener la URL preasignada para la carga de archivos y devolver la clave del archivo
Request
JSON
Query Parameters:
- region: string (default: "EU")
- fileExtension: string (mp3, wav, aac, m4a, flac)
Response
JSON
{
  "url": "https://storage.dubsmart.ai/uploads/...",
  "key": "uploads/user_id/filename.mp3"
}

Ejemplos de código de la API de clonación de voz

Ejemplos de código listos para usar en varios lenguajes de programación
JavaScript Example
// JavaScript/Node.js Example
const axios = require('axios');

const API_KEY = 'your_api_key_here';
const BASE_URL = 'https://dubsmart.ai/api/v1';

async function createCustomVoice() {
  try {
    // Step 1: Get upload URL
    const uploadResponse = await axios.get(`${BASE_URL}/upload`, {
      params: {
        region: 'EU',
        fileExtension: 'mp3'
      },
      headers: { 'Authorization': `Bearer ${API_KEY}` }
    });

    console.log('Upload URL:', uploadResponse.data.url);
    
    // Step 2: Upload audio file (you would use the presigned URL here)
    // This is typically done with a PUT request to the presigned URL
    
    // Step 3: Create custom voice
    const voiceResponse = await axios.post(`${BASE_URL}/custom-voices/create`, {
      name: 'My Custom Voice',
      examplePath: uploadResponse.data.key
    }, {
      headers: { 'Authorization': `Bearer ${API_KEY}` }
    });

    console.log('Custom voice created:', voiceResponse.data);
    
    // Step 4: List custom voices
    const voicesResponse = await axios.post(`${BASE_URL}/custom-voices/list`, {
      limit: 10
    }, {
      headers: { 'Authorization': `Bearer ${API_KEY}` }
    });

    console.log('Custom voices:', voicesResponse.data.items);
    
    return voiceResponse.data;
  } catch (error) {
    console.error('Error:', error.response?.data || error.message);
  }
}

// Usage
createCustomVoice();

Preguntas frecuentes sobre la API de clonación de voz

¿Qué es la API de clonación de voz y cómo funciona?Nuestra API de clonación de voces le permite crear voces AI personalizadas a partir de muestras de audio. Solo tienes que subir un archivo de audio, crear una voz personalizada y utilizarla en tus proyectos de doblaje TTS y AI.
¿Qué formatos de audio son compatibles con la clonación de voz?Admitimos los formatos de audio MP3, WAV, AAC, M4A y FLAC. El archivo de audio debe ser de 20 segundos sin ruido de fondo para obtener resultados óptimos de clonación de voz.
¿Cuántas voces personalizadas puedo crear?En los planes de pago, puedes crear un número ilimitado de voces personalizadas.
¿Cuánto se tarda en crear una voz personalizada?La clonación de voz suele tardar unos segundos, dependiendo de la longitud y complejidad del audio.
¿Puedo utilizar voces personalizadas en proyectos TTS?Sí. Una vez creadas, tus voces personalizadas pueden utilizarse en proyectos TTS haciendo referencia al ID de voz. Funcionan a la perfección con nuestra API de conversión de texto a voz para generar un habla que suene natural.
¿Puedo utilizar voces personalizadas en proyectos de doblaje AI?Sí. Una vez creadas, sus voces personalizadas pueden utilizarse en proyectos de Doblaje AI haciendo referencia al ID de voz. Funcionan a la perfección con nuestra API de Doblaje AI para generar voz con sonido natural.
¿Están seguros y son privados mis datos de audio?Absolutamente. Nos tomamos muy en serio la privacidad de los datos. Tus archivos de audio están encriptados y almacenados de forma segura. Puedes eliminar las voces personalizadas y sus datos de audio asociados en cualquier momento.