Strojové učení dokáže odhalit, kdo je autorem kódu

Strojové učení dokáže odhalit, kdo je autorem kódu

Programátoři mají podobně jako spisovatelé každý svůj odlišný styl psaní. Není ho bez dlouhé analýzy kódu jednoduché objevit, ale určité shodné znaky najít lze. A protože manuální hledání těchto prvků je zdlouhavé, výzkumníci z americké Drexel University vytvořili systém strojového učení, který je umí hledat sám.

Cílem podobného systému je deanonymizovat kódy, respektive jednodušeji zjišťovat, kde je jejich autorem. Jakmile je algoritmus vycvičen na vzorcích prací určitého člověka, dokáže na základě stanovených prvků poznat, jaké kódy tato osoba dále vytvořila.

Výzkumníci k testování použili kódy od 600 programátorů, kteří se účastnili každoroční programátorské soutěže Googlu Code Jam. Od každého jich měli osm. Algoritmus vytrénovali na jednom a jeho cílem bylo v celém vzorku poznat, jakých dalších sedm patřilo tomu konkrétnímu autorovi.

Výsledky byly solidní, byť ne perfektní. Systému se podařilo autora poznat v 83 procentech případů. To i tak stačí na to, aby algoritmus představoval skvělý nástroj pro policii, například při hledání autorů malwarů a jiných škodlivých programů, kteří se mnohdy snaží své autorství hodit na někoho jiného.

Stejně tak může být systém nápomocný při odhalování případů plagiátorství, protože dokáže rozpoznat rozdíl mezi náhodnou shodou a okopírováním stylu. Přeci jen, počítačové programy jsou chráněny autorským zákonem.

Je tu ale otázka ochrany soukromí a práva na anonymitu. Ne každý se chce ke svému programu nutně hlásit a nemusí to být jen kvůli kriminálním záměrům. Pomocí tohoto algoritmu jsou ale všichni programátoři potenciálně odhalitelní. Každé budoucí použití systému tak bude muset být pečlivě promyšleno.

Diskuze (9) Další článek: Zdá se, že na Měsíci kdysi mohly být podmínky vhodné pro život

Témata článku: Google, Umělá inteligence, Programování, Strojové učení, Kód, Určitý člověk, Skvělý nástroj, Programátor, Výzkumník, Podobný systém, Odlišný styl, Autorský zákon, Počítačový program, Hledání, Náhodná shoda, Algoritmus, Autor


Určitě si přečtěte

Jak funguje největší akumulátor v Česku: podívejte se do elektrárny Dlouhé Stráně

Jak funguje největší akumulátor v Česku: podívejte se do elektrárny Dlouhé Stráně

** Přečerpávací vodní elektrárna Dlouhé stráně je obdivuhodné technické dílo ** Stejná turbína vyrábí elektřinu i tlačí vodu zpět do horního jezera ** Strojovna elektrárny je zabudována v podzemí

David Polesný | 34

Američtí mariňáci si tisknou kasárna z betonu na 3D tiskárně

Američtí mariňáci si tisknou kasárna z betonu na 3D tiskárně

** Americká námořní pěchota nedávno představila 3D tištěná kasárna pro vojáky ** Ty jim tiskne velká 3D tiskárna na beton ** Výsledkem je solidní obytný prostor, který je slušně chráněný před nepřátelskou palbou

Stanislav Mihulka | 18

Na Zemi je nejtepleji za posledních více než 100 tisíc let. Co nám hrozí?

Na Zemi je nejtepleji za posledních více než 100 tisíc let. Co nám hrozí?

** Letošní červenec byl třetím nejteplejším měsícem od roku 1880 ** Teplota naší planety roste raketovým tempem ** Co lidstvu hrozí v období, které v minulosti nemá obdoby?

Karel Kilián | 68

Proč je pro obézní lidi tak těžké shodit nadbytečná kila?

Proč je pro obézní lidi tak těžké shodit nadbytečná kila?

** Obézním lidem selhávají mechanismy, jež je mají chránit před nadměrným příjmem potravy ** Mozek tlouštíků ignoruje hormon leptin varující před hromaděním tukové tkáně v těle ** Vědci nyní odhalili, jak to udělat, aby mozek otupený obezitou leptin opět vnímal

Jaroslav Petr | 46

Porno insider: Jak Greg Lansky mění internet pro dospělé

Porno insider: Jak Greg Lansky mění internet pro dospělé

** Erotický obsah generoval ohromné peníze, pak ale přišel internet... ** Pornografie dostupná všude a zdarma uvedla tvůrce do krize ** Někteří ale dokázali potenciál internetu využít i v tomto oboru

Jan Dudek | 12


Aktuální číslo časopisu Computer

Megatest: 13 grafických karet

Srovnání 7 dokovacích stanic s USB-C

Jak na perfektní noční fotografie

Kvalitní zdroje informací pro sebevzdělávání