Strojové učení dokáže odhalit, kdo je autorem kódu

Strojové učení dokáže odhalit, kdo je autorem kódu

Programátoři mají podobně jako spisovatelé každý svůj odlišný styl psaní. Není ho bez dlouhé analýzy kódu jednoduché objevit, ale určité shodné znaky najít lze. A protože manuální hledání těchto prvků je zdlouhavé, výzkumníci z americké Drexel University vytvořili systém strojového učení, který je umí hledat sám.

Cílem podobného systému je deanonymizovat kódy, respektive jednodušeji zjišťovat, kde je jejich autorem. Jakmile je algoritmus vycvičen na vzorcích prací určitého člověka, dokáže na základě stanovených prvků poznat, jaké kódy tato osoba dále vytvořila.

Výzkumníci k testování použili kódy od 600 programátorů, kteří se účastnili každoroční programátorské soutěže Googlu Code Jam. Od každého jich měli osm. Algoritmus vytrénovali na jednom a jeho cílem bylo v celém vzorku poznat, jakých dalších sedm patřilo tomu konkrétnímu autorovi.

Výsledky byly solidní, byť ne perfektní. Systému se podařilo autora poznat v 83 procentech případů. To i tak stačí na to, aby algoritmus představoval skvělý nástroj pro policii, například při hledání autorů malwarů a jiných škodlivých programů, kteří se mnohdy snaží své autorství hodit na někoho jiného.

Stejně tak může být systém nápomocný při odhalování případů plagiátorství, protože dokáže rozpoznat rozdíl mezi náhodnou shodou a okopírováním stylu. Přeci jen, počítačové programy jsou chráněny autorským zákonem.

Je tu ale otázka ochrany soukromí a práva na anonymitu. Ne každý se chce ke svému programu nutně hlásit a nemusí to být jen kvůli kriminálním záměrům. Pomocí tohoto algoritmu jsou ale všichni programátoři potenciálně odhalitelní. Každé budoucí použití systému tak bude muset být pečlivě promyšleno.

Diskuze (9) Další článek: Zdá se, že na Měsíci kdysi mohly být podmínky vhodné pro život

Témata článku: Google, Umělá inteligence, Programování, Strojové učení, Kód, Autorský zákon, Odlišný styl, Skvělý nástroj, Náhodná shoda, Autor, Počítačový program, Výzkumník, Hledání, Podobný systém, Určitý člověk, Programátor, Algoritmus


Určitě si přečtěte

Google má nové telefony, počítač a domácí displej. Česko je stále mimo

Google má nové telefony, počítač a domácí displej. Česko je stále mimo

** Google dnes představil novinky ** Dočkali jsme se nového telefonu Pixel 3, tabletopočítače a domácího displeje ** Rozšíření Google Assistenta do dalších zemí se bohužel nekoná

David Polesný | 45

Vylaďte si Wi-Fi: Podívejte se, jaká pásma máte doma volná a kam signál nedosáhne

Vylaďte si Wi-Fi: Podívejte se, jaká pásma máte doma volná a kam signál nedosáhne

** Prozkoumejte, jaké pásmo je pro vaši síť nejlepší ** Díky heat mapě snadno poznáte, kde to bude se signálem horší ** Vše zvládnete i z mobilního telefonu

Vladislav Kluska | 36

Čtyřicet procent je moc. Spalovací motory nedokážou splnit požadavek EU na snížení emisí

Čtyřicet procent je moc. Spalovací motory nedokážou splnit požadavek EU na snížení emisí

** EP nařídil automobilkám snížit o 40 % emise CO2 ** EU chce zvýšit podíl elektromobilů ** Výrobci hrozí ztrátou pracovních míst

Karel Kilián | 231


Aktuální číslo časopisu Computer

Odhalte skryté funkce Windows 10

Test levných Androidů do 4 000 Kč

Srovnání úsporných minipočítačů

Změřili jsme rychlost 10Gb/s ethernetu