OpenAI říká, že Voice Engine začala vyvíjet koncem roku 2022 a používá jej v API pro převod textu na řeč, také jeho výsledky můžete slyšet ve formě přednastavených hlasů v ChatGPT. Plus má Voice Engine k dispozici asi desítka ověřených partnerů společnosti OpenAI.
S dalším vypouštěním enginu mezi lidi však OpenAI váhá. Z pochopitelných důvodů. Možnost vygenerovat takto uvěřitelný mluvený projev je velmi užitečná, ale bohužel také snadno zneužitelná. OpenAI ve svém vyjádření zmiňuje, že s blížícími se prezidentskými volbami jde o obzvláště citlivé období. Deep fake je velké téma i pro vládu USA a legislativa teprve vzniká.
OpenAI zmiňuje některá opatření, která aplikovala na výše zmíněný úzký okruh ověřených partnerů, jimž zatím technologii poskytla.
- Voice Engine bude použit pouze s výslovným a informovaným souhlasem člověka, jehož hlas použije k učení a generování.
- Posluchač musí být informován, že poslouchá řeč generovanou pomocí AI.
- Voice Engine opatří každou nahrávku blíže nespecifikovaným watermarkem, pomocí kterého se dá jednoznačně identifikovat konkrétní uživatelský účet.
- Bezpečnostních prvků je podle OpenAI více, mají zamezit například použití technologie pro obcházení systémů hlasové identifikace. Podrobnosti však firma nezveřejnila.
Zdroj: OpenAI, zvukové ukázky The Verge