Košík je prázdný

Jak zastavit spamování webu

Přistupujme ke spamování webu objektivně a řekněme si jak se proti útokům robotů bránit a kde jsou slabá místa. Nejčastější druh spamu je spam registracemi, spam komentářů, spam příspěvků a spam kontaktního formuláře.

Dnes se weby na míru již téměř nedělají a většina webů je postavena na známých CMS systémech jako wordpress nebo joomla, diskuzní fóra jako PHPBB, SMF apod. Tyto systémy mají otevřený kód a proto mohou tvůrci spambotu vytvořit spambota přesně dle funkcí konkrétních systémů.

1) Přepsat registrační funkce

CMS systémy jsou psány modulově, proto není problém přejmenovat registrační funkce tak, aby je spambot nemohl detekovat. Téměř každý CMS systém provozuje fórum podpory, kde často ne-programátoři najdou přesný návod jak registrační funkce změnit.

2) Kontrolní otázka

Spamboti jsou každým dnem inteligentnější a proto kontrolní otázka musí být také sofistikovanější.

NE

  • 3x5 = 15
  • Opiš [slovo] = slovo

ANO

  • První a třetí písmeno slova [čau] = ču
  • Hlavní město ČR = Praha

Tvůrci spambotů jsou z bývalého sovětského svazu, z Číny a anglicky mluvící, proto použijte v odpovědi diakritiku české abecedy a spamboti nemají šanci.

3) CAPTCHA(Turing test)

CAPTCHA je akronym pro completely automated public Turing test to tell computers and humans apart, v překladu „Plně automatický veřejný Turingův test k odlišení počítačů a lidí. Test spočívá v zobrazení obrázku s málo nebo hodně deformovaným textem, přičemž úkolem uživatele je zobrazený text opsat do příslušného vstupního políčka. Předpokládá se, že lidský mozek dokáže správně rozeznat deformovaný text, ale internetový robot při použití technologie OCR nebude schopen text správně rozpoznat.

Dlouhou dobou byla Captcha velmi dobrý nástroj pro odfiltrování spambotu. Se zdokonalením OCR technologie však stále více spambotu dokáže projít skrze Captchu.

Některé společnosti, které se spamem žíví na plný úvazek šli ještě dál a jejich spamboti fungují trochu jiným způsobem. Spambot přijde na stránku, okopíruje obrázek Captchy, obrázek pošle většinou do Indie, callcentrum indů captchu opíše a robotu sdělí co má do Captchy doplnit.

Aktuálně nejpoužívanější a nejpodporovanější Captcha je https://www.google.com/recaptcha

4) Filtrace neexistujicích mailů

Spamboti potřebují pro svoji funkci velké množství email adres, které zadávají během registračních procesů. Vysloveně si zamilovali gmail.com, nicméně většina těchto email adres ve skutečnosti neexistuje. Můžete tedy rozšířit registrační proces o kontrolu založenou na kontrole DNS záznamu. Jedná se především o existenci MX záznamů a úrovně SPF záznamů.

5) IP adresy a emaily na blacklistu

Ze všech výše uvedených metod se nám nejvíce osvědčila kontrola IP adresy a emailu vůči databázi spamerů, kterou udržuje projekt Stop Forum Spam. Stop Forum Spam umožňuje vzdálenou kontrolu registračních údajů přes API a pro ne-programátory nabízí moduly a pluginy pro nejběžnější CMS systémy a fóra. Ostatní provozovatelé webů a fór mohou automaticky přidávat spamery ze svych fór do databáze a tím spamery na příště odstřihnout úplně.


Závěrem

Otestovali jsme všechny uvedené metody proti spamerům na našich webech a vítězné metody jsou

  • kontrolní otázka
  • ověření vůči projektu Stop Forum Spam

Každá metoda sama o sobě dokáže odfiltrovat 99,96% všech spamerů(brán vzorek 400 000 pokusů o registraci do CMS Joomla a fóra na SMF). Obě metody dohromady dokázali zatím odfiltrovat 100% spamu.