Een professionele voiceover laten maken kost normaal €100–500 per minuut audio. Met AI doe je hetzelfde in seconden, voor een fractie van de prijs. Dit is hoe je een voiceover maakt die goed genoeg is voor videos, e-learning en podcasts.
Drie tools vergeleken
| ElevenLabs | Murf | Play.ht | |
|---|---|---|---|
| Realisme | ⭐⭐⭐⭐⭐ (beste) | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
| Beste voor | Video, content creators | E-learning, zakelijk | Podcasts, bulk-audio |
| Gratis plan | 10.000 tekens/maand | Beperkte preview | 12.500 woorden/maand |
| Betaald (starter) | $5/maand | $19/maand | $31/maand |
| Stemklonen | Ja (Starter+) | Nee | Ja (betaald) |
| Nederlands | Goed | Beperkt | Goed |
💡 Beginner-tip: Ga naar elevenlabs.io, maak een gratis account, ga naar Text to Speech en plak een stuk tekst in. Kies een stem uit de bibliotheek, klik Generate en luister. Je hebt geen creditcard nodig voor het gratis plan.
Stap 1: kies de juiste stem
ElevenLabs heeft een bibliotheek van honderden stemmen. Filter op:
- Taal: kies bij voorkeur een stem die getraind is op de taal van je tekst
- Geslacht en leeftijd: sluit aan bij je merk of doelgroep
- Gebruik: “narration” voor documentaires en e-learning, “conversational” voor video’s en social content
Klik op het afspeelicoon bij een stem om een preview te horen. Test altijd een korte passage uit je eigen tekst — niet de preview-tekst — voordat je de stem kiest.
Stap 2: stel spraakparameters in
ElevenLabs laat je de volgende parameters aanpassen:
- Stability (0–100%): hogere waarden = consistenter maar monotoner; lagere waarden = meer variatie maar minder voorspelbaar. Start op 50% voor gesproken tekst.
- Clarity + Similarity Enhancement: hogere waarden maken de stem scherper en duidelijker; zet dit hoog voor tekst die goed verstaanbaar moet zijn.
- Style Exaggeration: versterkt emotie en expressie. Gebruik dit spaarzaam — te hoog klinkt overdreven.
⚡ Gevorderd: Gebruik SSML-tags of ElevenLabs’ eigen annotaties om pauzes, nadruk en toon te sturen. Voeg
<break time="0.5s"/>toe voor een korte pauze, of omsluit een woord met<emphasis>voor nadruk. Handig voor spots, advertenties of e-learning waarbij timing belangrijk is.
Stap 3: je eigen stem klonen
Ga in ElevenLabs naar Voices → Add a new voice → Instant Voice Cloning.
Vereisten voor een goede kloon:
- Audio van 1–3 minuten, schone opname (geen achtergrondgeluid, echo of muziek)
- Spreek in jouw normale spreektoon — niet overdreven articuleren
- MP3 of WAV, minimaal 44.1 kHz
Upload het bestand, geef de stem een naam en klik Add Voice. Binnen een minuut heb je een kloon beschikbaar in je stembibliotheek.
Test de kloon met een stuk tekst dat je niet hebt gebruikt in de trainingsopname. Zo zie je hoe goed de AI generaliseert naar nieuwe tekst.
Stap 4: exporteer en synchroniseer met video
Download de audio als MP3 (voor web en sociale media) of WAV (voor professionele productie). In ElevenLabs kun je ook direct een script uploaden en per alinea een andere stem kiezen — handig voor dialogen.
Zet de audio in je video-editor (Premiere Pro, DaVinci Resolve, CapCut) op de audiotijdlijn en synchroniseer met beeld. AI-voiceovers hebben weinig “ademhaling” en pauzes — voeg handmatig een korte stilte toe aan het begin en einde voor een naturalere montage.
Checklist: ben je klaar?
- Stem gekozen en getest met eigen tekst (niet de preview-tekst)
- Stability en Clarity ingesteld op basis van het gebruik
- Bij stemklonen: schone opname van 1-3 minuten aangeleverd
- Audio gedownload in het juiste formaat (MP3 voor web, WAV voor productie)
- Commercieel gebruik: betaald plan actief en licentievoorwaarden gelezen