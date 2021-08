Laboratoř OpenAI se zkraje letních prázdnin pochlubila studií na Arxivu, která popisuje nový jazykový AI model Codex. Vychází z její starší technologie textového generátoru GPT (Generative Pre-trained Transformer), namísto tvorby běžného dialogu nad sklenkou vína ale autoři k učení použili veřejně publikované kódy na GitHubu.

Codex proto umí programovat. A to poměrně neotřelým způsobem. V lidské řeči mu sdělíte, co má udělat, načež vygeneruje drobný úryvek funkčního kódu. Na videu níže se podívejte, jak to Codex zvládne levou zadní třeba s Javascriptem.

Ukázka, jak OpenAI Codex generuje zdrojový kód v Javascriptu:

Podobnou technologii má i Microsoft

Nutno podotknout, že se principiálně nejedná o nic nového, podobný přístup si totiž vyzkoušel už na jaře také Microsoft. I on použil jazykový model GPT (konkrétně generaci GPT-3) a podle zadání v běžné angličtině dokázal vytvořit programový kód v jazyku Power Fx. Firma se s tím pochlubila na letošní vývojářské konferenci Build 2021.

Ukázka, jak GPT-3 generuje z lidského zadání kód v Power Fx:

Power Fx je nicméně zástupce programovacích jazyků z ranku low-code, které jsou poměrně jednoduché a v sémantice i syntaxi docela přímočaré, takže je automat dokáže generovat o to snadněji. Power Fx totiž vychází ze zápisu jednořádkových výrazů v Excelu a Microsoft jej pouze adekvátně rozšířil o řešení problémů v byznysové analytické platformě Power BI.

V tomto směru vypadá Codex mnohem pokročileji.

A také GitHub

Jelikož se Codex učil na veřejných kódech z GitHubu, je třeba připomenout ještě jednu technologii právě od zmíněného GitHubu. Firma ji představila taktéž letos na jaře, jmenuje se Copilot a tentokrát je to AI doplňovač úryvku kódu. Takový auto-complete na steroidech.



Copilot doplnil algoritmus v Javascriptu pro získání tweetu uživatele skrze Twitter API

I tato technologie se učila programovat analýzou zdrojových kódů na svém vlastním skladišti a slouží k tomu, aby kodér začal psát kód, načež Copilot odhadne, oč mu asi tak jde, a doplní zbytek algoritmu.

V každém případě, všechny zmíněné technologii jsou stále v aktivním vývoji nebo v uzavřených betaverzích, čeho tedy skutečně dosáhnou, ukáže až jejich případné nasazení v reálné praxi.

IBM CodeNet

Syntéza programového kódu pomocí prvků AI je v posledních letech velké téma a další technologická výzva s ohromným potenciálem. Zabývají se jí proto i ostatní velcí hráči v oboru. Třeba IBM, které letos představilo projekt CodeNet.

Jak už název napovídá, má to být obří skladiště licenčně použitelných zdrojových kódů, které jsou vhodné právě pro strojové učení robotů zítřka, jenž možná jednou zcela nahradí většinu juniorních kodérů z masa a kostí a zůstanou jen ti seniorní. A samozřejmě produktoví manažeři.