cara membuat suara narasi AI bahasa Indonesia untuk video

Suara Narasi Pro Cuma 30 Detik? Begini Caranya

Jujur, waktu pertama nyoba AI Text-to-Speech saya agak skeptis. Awalnya saya kira suaranya bakal kaku kayak robot lawas. Ternyata, cuma butuh setup singkat plus trik SSML, suara narasi bisa natural ala profesional—tanpa butuh mikrofon mahal atau ruang kedap suara.

Tools Gratis yang Saya Pakai

  • ElevenLabs (free trial dengan 10.000 karakter)
  • TTSMP3.com (gratis 300 karakter/hari tanpa login)
  • n8n untuk otomatisasi panggil API, download, dan simpan file

Langkah Demi Langkah Bikin Suara Narasi AI

  1. Daftar dan ambil API key ElevenLabs

    Buka elevenlabs.io, klik “Sign Up”, lalu catat API key di dashboard. Gratis trialnya lumayan untuk beberapa video pendek.

  2. Siapkan teks dengan markup SSML sederhana

    Contoh SSML:

    <speak>
      Halo teman-teman! 
      <break time="300ms"/>
      Selamat datang di channel kita.</speak>

    Yang bikin enak: jeda di titik penting, supaya narasinya terasa natural.

  3. Generate via web UI atau langsung pakai n8n

    Kalau masih manual, copy-paste SSML ke UI ElevenLabs, pilih “Indonesian Female” atau “Male”, lalu klik “Generate”. Download MP3.

    Kalau pengin otomatis:

    {
      "nodes": [
        {
          "parameters": {
            "authentication": "headerAuth",
            "url": "https://api.elevenlabs.io/v1/text-to-speech/id_f_001/stream",
            "method": "POST",
            "responseFormat": "file",
            "options": {},
            "headerParametersJson": "={\"xi-api-key\": \"$node[\"Set Api Key\"].json[\"apiKey\"]\"}",
            "bodyParametersJson": "={\"text\": $json[\"ssmlText\"],\"voice_settings\": {\"stability\":0.6,\"similarity_boost\":0.7}}"
          },
          "name": "HTTP Request EleLabs",
          "type": "n8n-nodes-base.httpRequest",
          "typeVersion": 1
        }
      ]
    }

    Hasilnya langsung MP3, tersimpan di folder pilihan.

  4. Masukkan ke timeline video

    Cukup drag & drop MP3 ke editor (CapCut, DaVinci Resolve, Premiere). Pasang sesuai scene.

Tips Biar Narasi Nggak Kaku

  • Jangan terlalu panjang sekali baca—pecah kalimat pakai <break> SSML.
  • Variasi pitch dan speed: stability 0.6–0.8, similarity_boost 0.7–0.9.
  • Sesuaikan intonasi: tambahkan emotive words (“wah”, “wow”, “sayang sekali”).
  • Coba beberapa voice variant: kadang suara pria lebih tegas, suara wanita lebih ramah.

Kesalahan yang Bikin Suara Kayak Robot

  • Teks tanpa tanda baca: AI baca tanpa jeda.
  • Kata asing dicampur IKUTAN nada Indonesia, jadi aneh.
  • Lupa edit SSML: default speed 1.0 terlalu cepat untuk bahasa kita.
  • Langsung pakai panjang >500 kata sekali generate—hasilnya monoton.

Beberapa Pertanyaan Umum

  • Apakah bisa offline?

    Untuk ElevenLabs wajib online. Kalau offline, coba Coqui TTS lokal tapi setup agak ribet.

  • Limit gratisannya?

    ElevenLabs: 10.000 karakter, TTSMP3: 300 karakter/hari. Minimal untuk video TikTok atau YouTube Shorts.

  • Bisa diintegrasi ke n8n?

    Iya, tinggal HTTP Request pakai header “xi-api-key”. Contoh JSON ada di atas.

  • Apa legal untuk komersial?

    Di free trial ElevenLabs, hak pakai masih oke untuk eksperimen. Untuk konten komersial, cek lisensi upgrade.

Yuk, sekarang suaramu siap jadi pro tanpa ribet dan tanpa mikrofon mahal. Selamat mencoba!

Comments

Popular Posts