Klonování hlasu je technika, při které AI model z krátké zvukové ukázky (často stačí 3–10 sekund) vyrobí syntetický hlas, který zní jako daná osoba. Modely jako ElevenLabs, Resemble.ai nebo OpenSource alternativy umí vyprodukovat hlas v reálném čase a říct cokoli. Útočník si nahraje hlas oběti z TikToku, Instagram Stories, voicemail-pozdravu, zavolá rodičům či dětem a pod tlakem žádá peníze.
Jak to funguje
AI model se trénuje na velkém korpusu hlasových dat (TTS — text-to-speech). Pro konkrétního člověka stačí dokmrazení (fine-tuning) na 3–60 sekundách jeho hlasu. Útočník: 1) najde nahrávku oběti (sociální sítě, podcast, voicemail), 2) klonuje ji v cloud službě (typicky 15 minut), 3) napíše scénář mám problém, 4) v reálném čase volá rodině přes službu, která syntetizuje hlas a posílá ho do hovoru.
Jak to rozpoznat
- Volající (znějící jako rodina) je v silném stresu, požaduje rychlou peněžitou pomoc.
- Kontext nesedí — vaše dcera je v Česku, ale volá z Prahy z nemocnice po nehodě, o které nic nevíte.
- Hovor je krátký, voláč nedovolí kontrolní otázky.
- Hlas je sice správný, ale chybí mu emocionální nuance — robotický rytmus, divné pauzy.
- Kontaktují vás přes neznámé číslo, ne přes vlastní mobil rodiny.
Co dělat
- Domluvte si v rodině bezpečnostní heslo — slovo, které zná jen rodina (oblíbené jídlo dítěte, jméno domácího zvířete). V krizi se ho zeptat. Útočník ho neví.
- Při volání o peníze vždycky zavěste a zavolejte zpět na vlastní číslo dotyčné osoby.
- Pošlete WhatsApp/SMS s kontrolní otázkou (jak se jmenoval náš první pes) — útočník neví.
- Nikdy neposílejte peníze na nový bankovní účet, který předtím nikdy nebyl používaný.
- Hlasové ukázky na sociálních sítích minimalizujte — víc než vám pomáhají, riskují, že je AI naklonuje.
Situace v SR
Česká policie eviduje od konce 2023 vlnu mami v nemocnici scamů — typický scénář: dcera v Praze studuje, rodiče v menším městě, útočník zavolá rodičům a v hlase dcery žádá rychle 30–80 tisíc kvůli údajné nehodě. V průměru 5–10 takových případů týdně. Banky reagují tím, že u nových příjemců nad 50 tisíc Kč uvalují 48hodinovou cooling-off pauzu — což výrazně sníží škody.
Časté otázky
Můžu rozeznat klonovaný hlas od skutečného?
Lidským sluchem často ne. Modely v 2025 jsou tak dobré, že běžný posluchač bez kontextu nepozná. Lepší je rodinné heslo + zpětný hovor na vlastní číslo dotyčné osoby.
Kolik nahrávky stačí, aby AI hlas naklonovala?
Zhruba 3 sekundy kvalitního zvuku (čistá řeč bez šumu). Pro dobrý klon stačí 30–60 sekund. Vaše Instagram Story s mluveným textem nebo voicemail je dostatečný.