Jak v dnešní době probíhá boj se spamem

Jan Kuneš, Vít Jurásek 23. dubna 2004

Další
článek Další mail nabízející 1 GB prostoru SDÍLET NA FACEBOOKU TWEETNOUT

Spam je v dnešní době vnímám jako závažný problém, který vyžaduje trvalé řešení. Společnost Kerio Technologies proto v uplynulých dnech implementovala do svých produktů dvě z nových technologií. Při této příležitosti jsme se zeptali zástupce společnosti na jeho názor na současnou situaci.

Společnost Kerio Technologies od začátku dubna přinesla zprávy o začlenění dvou nových technologií do jejich produktů.

První novinkou je začlenění technologie společnosti Internet Security Systems pro filtrování e-mailů a blokování spamu. Technologie využívá propracovaný postup analýzy e-mailů, který užitím několika zkušebních technik kontroluje všechny e-mailové části a obsah zprávy. Prvním produktem, zahrnujícím ISS technologii filtru e-mailů, bude Kerio WinRoute Firewall. Nová verze se připravuje na konec letošního jara.

Druhou novinkou je implementace antispamové technologie Microsoft Caller ID do produktu Kerio MailServer. Pomocí technologie Caller ID může uživatel zjistit, zda e-mailové zprávy skutečně pochází od toho uživatele, který je uveden v záhlaví zprávy. Úspěch tohoto elegantního antispamového nástroje však do značné míry závisí na tom, zda dodavatelé poštovních serverů a správci IT tuto technologii přijmou.

V minulosti se objevilo mnoho neúspěšných pokusů o návrh univerzální technologie, která by řešila problém spamu. Caller ID má však velkou šanci na úspěch, a to hned ze tří hlavních důvodů: snadno se implementuje a nevyžaduje, aby klasifikaci spamu prováděla centrální organizace, počítá s tím, že se bude v průmyslovém odvětví prosazovat postupně a má silnou podporu ze strany společnosti Microsoft a služby Hotmail.

Caller ID je součástí aplikace Kerio MailServer 5.7.8, vydané dne 5. dubna 2004.

Rozhovor

Na naše otázky odpovídal vedoucí vývojového týmu KMS ze společnosti Kerio Technologies - Jaroslav Šnajdr.

Jaké jsou v současné době používané technologie pro boj se spamem? Většině uživatelů se vybaví filtrování příchozí pošty na základě nepovolených emailových adres, případně podle klíčových slov v textu.

Technologie pro potírání spamu lze zhruba rozdělit na tři skupiny. Do první a nejdůležitější skupiny patří klasifikace pošty podle obsahu. Určitá slova v textu zprávy, její hlavičky, struktura a formát jsou specifické pro spam a člověk podle nich pozná nevyžádanou zprávu většinou na první pohled. Automatické spamové filtry používají různé heuristické a statistické metody pro rozpoznání spamu, které je třeba neustále vylepšovat, protože spammeři tyto metody studují a snaží se je ve svých spamech obejít. Většina filtrů se umí učit na zprávách, které uživatel označí jako chybně klasifikované.

Druhá skupina technologií se snaží spammery vytáhnout z anonymity a prověřuje adresu odesílatele zprávy. Jedna z metod je např. ověření, jestli doména odesílatele vůbec existuje v DNS a má platné záznamy pro elektronickou poštu (A nebo MX). Jiné, účinnější metody jako Caller ID nebo SPF, vyžadují, aby administrátoři domén aktivně publikovali v DNS speciální záznamy s potřebnými informacemi. Tyto metody budou účinné teprve až budou na internetu dostatečně rozšířené. Do této skupiny je možné také zařadit kontrolu IP adres odesílatelů ve veřejných blacklistech jako ORDB nebo MAPS.

Metody ze třetí skupiny chrání váš mailový server před zneužitím spammery. Patří sem zabezpečení serveru proti open relay, různé ochrany před zahlcením serveru a DoS útoky, jako např. limity na počet a frekvenci příchozích zpráv z jedné adresy. Jedna ze zajímavých metod je ochrana proti tzv. Directory Harvest útoku. Při tomto útoku se spammer připojí na váš server a začne se pokoušet poslat zprávu postupně na stovky a tisíce schránek od A až do Z. Pokud se mu podaří s některými adresami uspět, zařadí si je do své databáze a začne na ně posílat spamy, popř. je prodá svým kolegům.

V poslední době hodně diskutovaným řešením je filtrování založené na tzv. bayesianském filtru. Jak hodnotíte účinnost, možnosti a budoucnost této technologie?

Bayesiánský filtr je statistická metoda pro klasifikaci textu podle jeho obsahu. Filtr si udržuje databázi slov a výrazů, ke kterým je přiřazena pravděpodobnost jejich výskytu v nevyžádaných zprávách. Analýzou celé zprávy filtr spočítá pravděpodobnost, že je to spam a podle nastavení oznámí výsledek. Název této technologie pochází z toho, že při tomto výpočtu se používá tzv. Bayesova věta o podmíněné pravděpodobnosti.

Aby byl Bayesiánský filtr účinný, je třeba ho pravidelně učit, tj. aktualizovat jeho databázi slov a pravděpodobností. Někteří výrobci poskytují aktualizované databáze podobně jako to dělají výrobci antivirů, ale filtr si může velmi pohodlně naučit i sám uživatel. K dosažení vysoké účinnosti stačí mu předhodit několik desítek zpráv a pravidelně ručně označovat spamy, které nebyly rozpoznány.

Bayesiánský filtr lze hodnotit jako jednoduchou a velmi účinnou metodu pro filtrování spamu, která se v současné době masově používá. Tento nebo podobný filtr je například součástí mailových klientů Outlook 2003 nebo Mozilla a používá se také v nejrozšířenějším spamovém filtru, open-source programu SpamAssassin.

Jaké řešení by podle vašeho názoru mohlo omezit spam?

Spammeři přestanou posílat spam tehdy, až se jim to přestane vyplácet. Spamové filtry musí být tak účinné a případný trestní postih tak odrazující, aby spamová reklama přestala být výnosná a účinná.

Jsou k dispozici údaje, kolik % z celosvětové emailové komunikace připadá na spam a automaticky rozesílané virové zprávy?

Odhaduje se, že až dvě třetiny veškeré emailové komunikace je nevyžádaná pošta.

Jak se díváte na iniciativu Billa Gatese a jeho řešení pro boj se spamem? Bez technologických inovací je patrně nelze provést. Je v současné době vůle k podobným změnám?

Caller ID, nedávno představený firmou Microsoft, je technologie, která umožňuje ověřit, jestli má zpráva zfalšovanou doménu odesílatele. Jestli se Caller ID dostatečně rozšíří, bude to další překážka v rozesílání spamu, ale v žádném případě to není překážka nepřekonatelná – spammeři budou mít těžší život, ale určitě je Caller ID nevyhladí.

Caller ID je technologická inovace, která nevyžaduje žádné změny v používaných protokolech – využívá standardní TXT záznamy v DNS a je snadné ji implementovat s použitím stávajících softwarových nástrojů. To je jedním z důvodů, proč má docela velkou šanci na brzké masové rozšíření. Hlavním důvodem je samozřejmě fakt, že je pod patronací velké a vlivné firmy, která má možnosti ji náležitě propagovat.

Existují v dnešní době technologie, které dokáží rozpoznat spam v obrázku nebo zvukovém souboru?

Ano, ale spíše než pro analýzu elektronické pošty se hodí pro filtrování webového obsahu. Existují technologie, které umí identifikovat nahé děvče na obrázku nebo sprostá slova ve zvukovém záznamu, ale nejsou zatím dostatečně vyspělé a výkonné pro masové nasazení. Při identifikaci spamu je zatím zdaleka nejúčinnější analýza jeho textového obsahu.

Diskuze (20) › Další článek: Další mail nabízející 1 GB prostoru

Témata článku: Microsoft, Open source, Spam, Spa, Pro, Zvuková technologie, Brzké rozšíření, Boj, Jak, Technologická inovace, Velká pravděpodobnost, Security Systems, Děvče, Statistická metoda, Podobná doména