Stability AI, tvůrce generátoru obrázků Stable Diffusion představilo další syntetizátor na bázi difuzní technologie. Tentokrát ovšem netvoří grafiku, ale zvuk.
Jmenuje se Stable Audio a po přihlášení si jej můžete vyzkoušet ve webovém rozhraní, byť to je nyní hodně přetížené, takže si počkáte.
Stačí napsat povel v angličtině
Funguje to vlastně úplně stejně jako u tvorby obrázku, takže zvuk o stanovené délce se vygeneruje pomocí textového zadání v angličtině – promptu.
Ukázka rozhraní generátoru Stable Audio a vytvořených zvuků:
Generátor se hodí třeba pro youtubery a další tvůrce obsahu, mohou si v něm totiž vytvořit nejrůznější zvukové efekty a muziku na pozadí.
Základ zdarma, delší zvuk od 12 dolarů
Firma proto rovnou připravila i placený paušál:
Paušál Free:
- Až 45 sekund zvuku
- Až 20 nahrávek měsíčně
- Jen pro nekomerční užití
- Zdarma
Paušál Professional:
- Až 90 sekund zvuku
- Až 500 nahrávek měsíčně
- I pro komerční použití
- 11,99 USD bez daně
Pravidla jsou stejná jako pro všechny ostatní generativní AI. Čím bude prompt kvalitnější, tím bude lepší i výstup. Inženýři ze Stability AI proto připravili i návod a ukázky, jak nejlépe pokládat příkazy.

Ukázky na webu s nápovědou včetně použitých promptů