API sao chép giọng nói

Tạo giọng nói AI tùy chỉnh từ mẫu âm thanh bằng API Cloning Giọng Nói của chúng tôi. Tải lên âm thanh, nhân bản giọng nói và sử dụng chúng trong Text to Speech hoặc AI Dubbing.
Sao chép giọng nói
Giọng nói tùy chỉnh
Giao diện lập trình ứng dụng REST
Voice Cloning Interface
Được tin cậy bởi hơn 500.000+ người dùng

Các tính năng mạnh mẽ của API sao chép giọng nói

Tất cả những gì bạn cần để tích hợp công nghệ sao chép giọng nói chuyên nghiệp vào ứng dụng của mình.
Không giới hạn
Sao chép giọng nói không giới hạnTạo giọng nói tùy chỉnh không giới hạn từ các mẫu âm thanh. Tải lên âm thanh ở định dạng MP3, WAV, AAC, M4A hoặc FLAC.
Chất lượng cao cấp
Âm thanh chất lượng caoTạo ra giọng nói tự nhiên bằng công nghệ AI tiên tiến. Hỗ trợ nhiều định dạng âm thanh và đầu ra chất lượng cao.
Thân thiện với nhà phát triển
Tích hợp dễ dàngGiao diện lập trình ứng dụng (API) REST đơn giản kèm theo tài liệu hướng dẫn chi tiết. Tích hợp công nghệ sao chép giọng nói vào ứng dụng của bạn chỉ với vài lệnh API.

Quy trình làm việc của API sao chép giọng nói

Tạo giọng nói tùy chỉnh chỉ với một vài lệnh API đơn giản.
01

Tải lên mẫu âm thanh

Nhận một URL đã được ký sẵn và tải lên tệp âm thanh của bạn ở các định dạng được hỗ trợ như MP3, WAV, AAC, M4A hoặc FLAC.
API Request
curl -X GET "https://dubsmart.ai/api/v1/upload?region=EU&fileExtension=mp3" \
  -H "Authorization: Bearer YOUR_API_KEY"

# Response:
{
  "url": "https://storage.dubsmart.ai/uploads/...",
  "key": "uploads/user_id/filename.mp3"
}

# Upload file
curl -X PUT -T your_audio_file.mp3 "https://storage.dubsmart.ai/uploads/..."
02

Tạo giọng nói tùy chỉnh

Tạo giọng nói tùy chỉnh bằng cách sử dụng mẫu âm thanh đã tải lên. Cung cấp tên và khóa tệp từ bước tải lên.
API Request
curl -X POST "https://dubsmart.ai/api/v1/custom-voices/create" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "name": "My Custom Voice",
    "examplePath": "uploads/user_id/filename.mp3"
  }'

# Response:
{
  "id": "67c123...",
  "name": "My Custom Voice",
  "examplePath": "https://...",
  "createdAt": "2024-01-15T10:30:00Z"
}'
03

Sử dụng trong các dự án TTS và lồng tiếng AI

Sử dụng ID giọng nói tùy chỉnh của bạn trong các dự án TTS và lồng tiếng AI.
API Request
curl -X POST "https://dubsmart.ai/api/v1/projects/tts" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "title": "My TTS Project",
    "segments": [
      {
        "text": "Hello world!",
        "voice": "67c123...",
        "language": "en"
      }
    ]
  }'

Các điểm cuối API sao chép giọng nói

Tài liệu tham khảo API đầy đủ kèm ví dụ cho tất cả các điểm cuối
GET
/upload

Lấy URL tệp tin để tải lên

Nhận URL đã được ký sẵn cho việc tải lên tệp và trả về khóa tệp.
Request
JSON
Query Parameters:
- region: string (default: "EU")
- fileExtension: string (mp3, wav, aac, m4a, flac)
Response
JSON
{
  "url": "https://storage.dubsmart.ai/uploads/...",
  "key": "uploads/user_id/filename.mp3"
}

Ví dụ mã API sao chép giọng nói

Các ví dụ mã nguồn sẵn sàng sử dụng trong nhiều ngôn ngữ lập trình
JavaScript Example
// JavaScript/Node.js Example
const axios = require('axios');

const API_KEY = 'your_api_key_here';
const BASE_URL = 'https://dubsmart.ai/api/v1';

async function createCustomVoice() {
  try {
    // Step 1: Get upload URL
    const uploadResponse = await axios.get(`${BASE_URL}/upload`, {
      params: {
        region: 'EU',
        fileExtension: 'mp3'
      },
      headers: { 'Authorization': `Bearer ${API_KEY}` }
    });

    console.log('Upload URL:', uploadResponse.data.url);
    
    // Step 2: Upload audio file (you would use the presigned URL here)
    // This is typically done with a PUT request to the presigned URL
    
    // Step 3: Create custom voice
    const voiceResponse = await axios.post(`${BASE_URL}/custom-voices/create`, {
      name: 'My Custom Voice',
      examplePath: uploadResponse.data.key
    }, {
      headers: { 'Authorization': `Bearer ${API_KEY}` }
    });

    console.log('Custom voice created:', voiceResponse.data);
    
    // Step 4: List custom voices
    const voicesResponse = await axios.post(`${BASE_URL}/custom-voices/list`, {
      limit: 10
    }, {
      headers: { 'Authorization': `Bearer ${API_KEY}` }
    });

    console.log('Custom voices:', voicesResponse.data.items);
    
    return voiceResponse.data;
  } catch (error) {
    console.error('Error:', error.response?.data || error.message);
  }
}

// Usage
createCustomVoice();

Câu hỏi thường gặp về API Cloning Giọng nói

Voice Cloning API là gì và nó hoạt động như thế nào?API Cloning Giọng Nói của chúng tôi cho phép bạn tạo ra các giọng nói AI tùy chỉnh từ các mẫu âm thanh. Chỉ cần tải lên tệp âm thanh, tạo giọng nói tùy chỉnh và sử dụng nó trong các dự án TTS và AI Dubbing của bạn.
Các định dạng âm thanh nào được hỗ trợ cho việc sao chép giọng nói?Chúng tôi hỗ trợ các định dạng âm thanh MP3, WAV, AAC, M4A và FLAC. Tệp âm thanh nên có độ dài từ 20 giây và không có tiếng ồn nền để đạt kết quả sao chép giọng nói tối ưu.
Tôi có thể tạo bao nhiêu giọng nói tùy chỉnh?Trên các gói dịch vụ trả phí, bạn có thể tạo số lượng không giới hạn các giọng nói tùy chỉnh.
Thời gian để tạo ra một giọng nói tùy chỉnh là bao lâu?Quá trình sao chép giọng nói thường mất vài giây, tùy thuộc vào độ dài và độ phức tạp của tệp âm thanh.
Tôi có thể sử dụng giọng nói tùy chỉnh trong các dự án TTS không?Đúng vậy! Sau khi được tạo, các giọng nói tùy chỉnh của bạn có thể được sử dụng trong các dự án TTS bằng cách tham chiếu đến ID giọng nói. Chúng hoạt động mượt mà với API Text-to-Speech của chúng tôi để tạo ra giọng nói tự nhiên.
Tôi có thể sử dụng giọng nói tùy chỉnh trong các dự án lồng tiếng AI không?Đúng vậy! Sau khi được tạo ra, các giọng nói tùy chỉnh của bạn có thể được sử dụng trong các dự án lồng tiếng AI bằng cách tham chiếu đến ID giọng nói. Chúng hoạt động mượt mà với API lồng tiếng AI của chúng tôi để tạo ra giọng nói tự nhiên.
Dữ liệu âm thanh của tôi có an toàn và riêng tư không?Chắc chắn rồi. Chúng tôi coi trọng việc bảo vệ dữ liệu cá nhân. Các tệp âm thanh của bạn được mã hóa và lưu trữ an toàn. Bạn có thể xóa các giọng nói tùy chỉnh và dữ liệu âm thanh liên quan bất cứ lúc nào.