Interfejs API klonowania głosowego

Twórz niestandardowe głosy AI z próbek audio za pomocą naszego interfejsu Voice Cloning API. Prześlij dźwięk, sklonuj głosy i użyj ich w funkcji Text to Speech lub AI Dubbing.
Klonowanie głosu
Niestandardowe głosy
REST API
Voice Cloning Interface
Zaufało mu ponad 500 000 użytkowników

Zaawansowane funkcje API klonowania głosowego

Wszystko, czego potrzebujesz, aby zintegrować profesjonalne klonowanie głosu ze swoimi aplikacjami
Bez ograniczeń
Nieograniczone klonowanie głosuTworzenie nieograniczonej liczby niestandardowych głosów z próbek audio. Przesyłaj pliki audio w formacie MP3, WAV, AAC, M4A lub FLAC.
Najwyższa jakość
Wysokiej jakości dźwiękGenerowanie naturalnie brzmiącej mowy dzięki zaawansowanej technologii AI. Obsługa wielu formatów audio i wysoka jakość dźwięku.
Przyjazny dla deweloperów
Łatwa integracjaProsty interfejs API REST z obszerną dokumentacją. Zintegruj klonowanie głosowe ze swoimi aplikacjami za pomocą zaledwie kilku wywołań API.

Przepływ pracy interfejsu API klonowania głosowego

Tworzenie niestandardowych głosów za pomocą kilku prostych wywołań API
01

Prześlij próbkę audio

Uzyskaj wstępnie podpisany adres URL i prześlij plik audio w obsługiwanych formatach, takich jak MP3, WAV, AAC, M4A lub FLAC.
API Request
curl -X GET "https://dubsmart.ai/api/v1/upload?region=EU&fileExtension=mp3" \
  -H "Authorization: Bearer YOUR_API_KEY"

# Response:
{
  "url": "https://storage.dubsmart.ai/uploads/...",
  "key": "uploads/user_id/filename.mp3"
}

# Upload file
curl -X PUT -T your_audio_file.mp3 "https://storage.dubsmart.ai/uploads/..."
02

Tworzenie własnego głosu

Utwórz niestandardowy głos przy użyciu przesłanej próbki audio. Podaj nazwę i klucz pliku z kroku przesyłania.
API Request
curl -X POST "https://dubsmart.ai/api/v1/custom-voices/create" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "name": "My Custom Voice",
    "examplePath": "uploads/user_id/filename.mp3"
  }'

# Response:
{
  "id": "67c123...",
  "name": "My Custom Voice",
  "examplePath": "https://...",
  "createdAt": "2024-01-15T10:30:00Z"
}'
03

Zastosowanie w projektach TTS i AI Dubbing

Używaj własnego identyfikatora głosowego w projektach TTS i AI Dubbing.
API Request
curl -X POST "https://dubsmart.ai/api/v1/projects/tts" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "title": "My TTS Project",
    "segments": [
      {
        "text": "Hello world!",
        "voice": "67c123...",
        "language": "en"
      }
    ]
  }'

Punkty końcowe interfejsu API klonowania głosowego

Kompletne odniesienie API z przykładami dla wszystkich punktów końcowych
GET
/upload

Pobierz adres URL przesyłanego pliku

Uzyskaj wstępnie podpisany adres URL do przesłania pliku i zwróć klucz pliku
Request
JSON
Query Parameters:
- region: string (default: "EU")
- fileExtension: string (mp3, wav, aac, m4a, flac)
Response
JSON
{
  "url": "https://storage.dubsmart.ai/uploads/...",
  "key": "uploads/user_id/filename.mp3"
}

Przykłady kodu Voice Cloning API

Gotowe do użycia przykłady kodu w wielu językach programowania
JavaScript Example
// JavaScript/Node.js Example
const axios = require('axios');

const API_KEY = 'your_api_key_here';
const BASE_URL = 'https://dubsmart.ai/api/v1';

async function createCustomVoice() {
  try {
    // Step 1: Get upload URL
    const uploadResponse = await axios.get(`${BASE_URL}/upload`, {
      params: {
        region: 'EU',
        fileExtension: 'mp3'
      },
      headers: { 'Authorization': `Bearer ${API_KEY}` }
    });

    console.log('Upload URL:', uploadResponse.data.url);
    
    // Step 2: Upload audio file (you would use the presigned URL here)
    // This is typically done with a PUT request to the presigned URL
    
    // Step 3: Create custom voice
    const voiceResponse = await axios.post(`${BASE_URL}/custom-voices/create`, {
      name: 'My Custom Voice',
      examplePath: uploadResponse.data.key
    }, {
      headers: { 'Authorization': `Bearer ${API_KEY}` }
    });

    console.log('Custom voice created:', voiceResponse.data);
    
    // Step 4: List custom voices
    const voicesResponse = await axios.post(`${BASE_URL}/custom-voices/list`, {
      limit: 10
    }, {
      headers: { 'Authorization': `Bearer ${API_KEY}` }
    });

    console.log('Custom voices:', voicesResponse.data.items);
    
    return voiceResponse.data;
  } catch (error) {
    console.error('Error:', error.response?.data || error.message);
  }
}

// Usage
createCustomVoice();

Najczęściej zadawane pytania dotyczące interfejsu API klonowania głosowego

Czym jest i jak działa Voice Cloning API?Nasz interfejs Voice Cloning API umożliwia tworzenie niestandardowych głosów AI z próbek audio. Wystarczy przesłać plik audio, utworzyć niestandardowy głos i użyć go w projektach TTS i AI Dubbing.
Jakie formaty audio są obsługiwane podczas klonowania głosowego?Obsługujemy formaty audio MP3, WAV, AAC, M4A i FLAC. Plik audio powinien mieć od 20 sekund bez szumów w tle, aby uzyskać optymalne wyniki klonowania głosu.
Ile niestandardowych głosów mogę utworzyć?W płatnych planach można tworzyć nieograniczoną liczbę niestandardowych głosów.
Jak długo trwa tworzenie niestandardowego głosu?Klonowanie głosu trwa zazwyczaj kilka sekund, w zależności od długości i złożoności dźwięku.
Czy mogę używać niestandardowych głosów w projektach TTS?Tak! Po utworzeniu niestandardowych głosów można ich używać w projektach TTS, odwołując się do identyfikatora głosu. Działają one płynnie z naszym interfejsem API Text-to-Speech do generowania naturalnie brzmiącej mowy.
Czy mogę używać niestandardowych głosów w projektach AI Dubbing?Tak! Po utworzeniu niestandardowych głosów można ich używać w projektach AI Dubbing, odwołując się do identyfikatora głosu. Działają one płynnie z naszym AI Dubbing API w celu generowania naturalnie brzmiącej mowy.
Czy moje dane audio są bezpieczne i prywatne?Absolutnie. Poważnie traktujemy prywatność danych. Pliki audio są szyfrowane i bezpiecznie przechowywane. Możesz usunąć niestandardowe głosy i powiązane z nimi dane audio w dowolnym momencie.