OpenAI | Neuronová síť

Dall-E má sourozence. Neuronka Point-E bude podle textového zadání tvořit 3D grafiku

Společnost OpenAI zveřejnila další generátor založených na neuronových sítích. Po Dall-E, který dokáže tvořit obrázky podle textových příkazů, a ChatGPT, s nímž si můžete povídat, přichází Point-E. Na GitHubu už jsou zdrojové kódy, na Arxivu pak celá studie, o co se pětice autorů pokoušela a čeho dosáhla.

Ve zkratce je Point-E něco jako Dall-E, ale místo 2D grafiky generuje 3D objekty. Tvůrci učili neuronku na sadě několika milionů dobře popsaných trojrozměrných modelů, které všechny renderovali v Blenderu ve 20 náhodných úhlech. Point-E podle textového zadání nejprve vytvoří 2D obrázek a pak doplní prostorové informace.

A jde mu to hodně rychle. S jednou výpočetní kartou Nvidia Tesla V100 vytvoří model za minutu či dvě. Výsledkem ale není tradiční meshová síť tvořená polygony, blíže má k voxelové grafice. Modelem je několik tisíc barevných teček (doslova „mrakových bodů“) se souřadnicemi XYZ.

Pokud si software nechcete složit rozjíždět na vlastním hardwaru, na Hugging Face je demo, které však běží hodně pomalu. Výsledky ale nejsou moc přesvědčivé. Zatímco studie ukazuje hezky vymodelovaného psa corgiho s vánoční čepicí, 3D brýle, sluchátka nebo dopravní kužel, na mé zadání se Point-E moc nepředvedl.

Basketbalový míč je sice oranžovo-černá koule, ale třeba vítězné gesto Usaina Bolta vypadá jako vybledlá přejetá liška. U banánu pak trefil barvu, ale tvar rozhodně ne.

SCR-20221221-muo.png
Tohle má být vítězná póza Usaina Bolta
Diskuze (2) Další článek: Apple připravoval počítač za čtvrt milionu. Chystaný Mac Pro ale nakonec bude jiný

Témata článku: , , , , , , , , , , , , , , , , ,