V lednu tomu bude rok od chvíle, kdy britsko-americký konglomerát Getty Images zažaloval vývojáře obrazových neuronek Stability AI. Uplynulo 11 měsíců a evropská větev případu skutečně zamíří před londýnský obchodní soud.
Getty Images viní Stability AI z toho, že své generativní neuronky z rodiny Stable Diffusion trénovalo bez svolení na jeho obřích katalozích fotografií a ilustrací. Pod GI spadají také galerie iStock a Unsplash a všechny databáze dohromady čítají okolo 500 milionů položek.
Bude to možná první precedens
Podobné množství obsahu dnes má i úhlavní konkurent Shutterstock, který ale k AI přistupuje smířlivěji a snaží se ji postupně integrovat do svých služeb.
Stable Diffusion umí malovat Prahu mimo jiné i díky tomu, že se učil na fotografiích z konglomerátu Getty Images. Z rané verze Stable Diffusion vzešlo i Midjourney
Ale zpět do Londýna. Stability AI se chtělo soudu vyhnout tvrzením, že i když má podstatnou část programátorů ve Velké Británii, obrázkové generátory trénovalo na amerických serverech Amazon Web Services a v té době v zámoří probíhal i vývoj. Jakékoliv žaloby by tedy měly směřovat výhradně k tamním (a prozatím benevolentnějším) orgánům.
To ale soudkyni Joannu Smith neobměkčilo, a tak bude tento případ dost možná prvním svého druhu, na kterém se utvoří určitý precedens.
Žaloby míří také na Midjourney a OpenAI
Stability AI totiž zdaleka není jedinou společností, která čelí žalobám. Ty míří také na konkurenční Midjourney a nakonec i OpenAI a Microsoft. Podstata sporů je přitom vždy stejná.
Zatímco žalované strany tvrdí, že použitím veřejně dostupných dat k učení neporušily autorská práva a že generovaný obsah je natolik pročištěný, že jej nelze spojovat s originály – a tedy nelicencovaným šířením původního díla –, mnoho výzkumných týmů v posledním roce a půl zjistilo, že s trochou snahy k tomu lze obrazové i textové generátory skutečně přinutit.
Obrázkové generátory jsou jen tak dobré, jak byl dobrý původní ilustrátor
Ať už je tomu jakkoliv, argument, že původní autor díla z generativní AI nic nemá, má určitě své opodstatnění. I když jsme totiž všichni paf z toho, co zvládnou nakreslit Midjourney a DALL-E 3, je třeba připomenout, že to oba dokážou pouze proto, že před nimi něco podobného nakreslil člověk z masa a kostí.
Obrázek vytvořený člověkem, který na veřejném internetu indexoval robot obří databáze obrázků pro strojové učení LAION
Většina generátorů se přitom učila na obrázcích stažených z veřejného internetu a bez patřičné licence. Dokud se jednalo o akademický a nekomerční výzkum (princip fair use), bylo to v pořádku. Jakmile ale firmy zapojily monetizaci, zrodil se problém.
Obrázek vytvořený generátorem Stable Diffusion, který se podařilo reprodukovat výzkumníkům z Marylandské univerzity (PDF)
Zdá se, že jediný, kdo by opravdu mohl být mimo hru, je Adobe s technologií Firefly. Firma totiž učila obrázkový generátor učila na licenčně ošetřených datech z vlastních katalogů.
To je nakonec i jediná čistá cesta. Chcete-li vytvořit komerční obrázkový generátor, v předstihu si zajistěte studijní fotografie s licencí, která umožňuje komerční transformaci díla pro využití v AI.