Alibaba má novou AI, která analyzuje lidské emoce. R1-Omni se chlubí tím, že je to první aplikace postavená na omni-multimodálním velkém jazykovém modelu, při jehož trénování byla použita technika zpětnovazebního učení s ověřitelným odměňováním. Informovala o tom agentura Bloomberg.
Respektive model vyprodukovala Tongyi Lab, která pod čínskou Alibabu spadá. Zatímco multimodální modely jsou schopné pracovat s více typy dat, omni-multimodální modely by v tomto ohledu prakticky neměly mít limit.
Právě ona technika zpětnovazebního učení s ověřitelným odměňováním je něco, co dle autorského týmu výrazně posílilo schopnosti modelu přemýšlet (reasoning), rozpoznávat emoce (emotion recognition) a generalizovat (generalization).
Co je zpětnovazebního učení s ověřitelným odměňováním
Ačkoli je celý proces složitý, dá se zjednodušeně popsat tak, že modelu je prostřednictvím zvláštní funkce dávána pozitivní zpětná vazba, když je výstup modelu správný. Samotná odměna je v tomto schématu ověřitelná, takže se validuje její správnost.
R1-Omni najdete na Githubu, kde výrobce na dvou videích ukazuje schopnosti technologie. Měly by být pokročilé, ukázka nicméně používá pouze velice základní deskriptory jako veselý a naštvaný. Novinka vznikla na bázi modelu HumanOmni-0.5B. Výše zmíněnou techniku nepoužila jako první.
Ve zveřejněném dokumentu Jiaxing Zhao, Xihan Wei a Liefeng Bo z Tongyi Lab tuto inovaci připisují konkurenčnímu DeepSeeku R1, který vody technologického světa rozvířil v lednu.
Alibaba svůj první velký jazykový model v reakci na OpenAI uvedla v dubnu 2023. Tongyi Qianwen od té doby vyšel v několika iteracích a variacích. Právě v lednu, kdy svět obdivoval DeepSeek R1, uvolnila Alibaba model Qwen 2.5-Max. Je schopný, podle Chatbot Areny však aktuální konkurenci včetně DeepSeek R1 nepřekonal.
Jisté je, že konkurence vůči americkým a dalším AI firmám posiluje. Alibaba před pár týdny oznámila partnerství s Applem, který v iPhonech na čínském trhu ve zhruba polovině roku nabídne jeho AI. GPT-4.5 od prominentní OpenAI vyšel v únoru a má lepší emoční inteligenci než jeho předchůdci, takže se lépe uplatní v komunikaci, coachingu apod. Není ovšem zdarma.