Első látásra a világ legegyszerűbb feladatának tűnhet megírni egy vásárlásra ösztönző e-mailt. A probléma azonban legtöbbször akkor kezdődik, amikor a levél útja véget ér. Vagyis a címzett postaládájában, méghozzá a spamszűrő miatt.
Az öntanuló, illetve tanítható spamszűrők miatt sajnos számos fontos küldemény is a levélszemétbe kerülhet. A szűrők ugyanis formátum és tartalom szerint is értékelik a beérkező leveleket, és ha nem megfelelően formáztunk, illetve fogalmaztunk, üzenetünk nagy valószínűséggel kapásból a spamtemetőben landol. Manapság ugyanis a rengeteg kéretlen levél miatt szinte mindenki spamszűrőt használ a nem kívánatos küldemények kiválogatására. Hogyan működnek ezek a szűrők, és hogyan kerülhetjük el, hogy a fontos küldemények is a levélszemétbe kerüljenek?
A spamszűrők taníthatóak: minél régebb óta használjuk postafiókunkat, és minél több levélszemetet jelöltünk már benne spamként, annál nagyobb valószínűséggel szűrik ki a nem kívánt küldeményeket. Sőt, megtaníthatjuk nekik, hogy az általában spamgyanúsnak ítélt szavakat ártatlannak minősítsék, vagy épp fordítva, attól függően, hogy általában milyen tartalmú leveleket szoktunk fogadni. Pontosabb spamszűrést és kevesebb hamis pozitív találatot eredményez a fehér, illetve fekete lista felállítása, amelyben összegyűjthetjük a biztonságos és a nem kívánatos feladókat. Szerencsére a szűrők nyilvános DNS-feketelistákat is elérnek, amelyek segítségével kiszűrik a legnagyobb spammelők által használt gyanús szerverekről érkező levélszemetet is.
Nézzük meg közelebbről a legizgalmasabb, tartalom alapú szűrőket, amelyek a levelek szövegében keresnek gyanús szavakat. A szűrők szerint vannak gyanúsabb és vannak ártatlanabb szavak. A valószínűségszámításra, pontosabban a Bayes-formulára épült algoritmus segítségével szinte teljesen kiszűrhetőek azok a szavak, amelyeket általában a kéretlen levelek tartalmaznak. Általában 1000 spamből kevesebb, mint 5 csúszik át egy ilyen típusú szűrőn, hamis pozitív találat nélkül.
Ha a „sex” szót megtalálja a szűrő a levélben, akkor azt 99 százalékos valószínűséggel spamnek értékeli. Ha a „sex” és a „sexy” szavak együttesen szerepelnek egy levélben, akkor a spam valószínűsége 99,9%. A spamekre jellemző szavak azonban természetesen előfordulhatnak fontos levelekben is. Viszont, mivel az ártatlan szavak kis valószínűséggel jelentenek spamet, az ő alacsony értékük kompenzálja a veszélyes szavak magas értékét.
Nézzünk egy példát egy angol nyelven írt levélből, amit az amerikai spamvadász, Paul Graham kapott:
- madam 99%
- promotion 99%
- republic 99%
- shortest 4,7225013%
- mandatory 4,7225013%
- standardization 7,347802%
- sorry 8,221981%
- supported 9,019077%
- people’s 9,019077%
- enter 90,75001%
- quality 89,21298%
- organization 12,454646%
- investment 85,68143%
- very 14,758544%
- valuable 82.347786%
A lista szerint a „shortest” szó lett a legkevésbé gyanús, a „promotion”, a „madam” és a „republic” viszont erőteljesen spam-szagú. Graham azt is megmagyarázza, hogy miért. A barátaimtól, ismerőseimtől, üzleti partnereimtől nem kapok olyan levelet, ami „Dear Sir, Madam” megszólítással kezdődik. Egy ismeretleneknek szánt, nem perszonalizált spam viszont valószínűleg így indít. A „promotion” magától értetődik, miért került be, a „republic” viszont egy érdekes eset. Azért került a leggyanúsabb kategóriába, mert a nigériai levelekként elhíresült spamek és társaik gyakran tartalmazzák. Ha a fenti eredményeket a Bayes-szabály szerint nézzük, akkor 90,27%-os valószínűségi értéket kapunk, a levél tehát szinte biztos, hogy spam.
Nem csak a tartalom, a formátum is fontos, egészen apró részletek is számíthatnak. Egyből kiszűrik például azokat a leveleket, amelyeknél a „Tárgy” rovatban csupa nagybetű szerepel. Az eDM-ek és a hírlevelek küldésénél fontos, hogy ezeket és a hasonló szó és formátumszűrési szempontokat is figyelembe vegyük, mert így nem akadnak majd fenn a spamszűrőkön a hasznos, valóban személyre szabott, és a címzett hozzájárulásával küldött levelek. Mindemellett az eDM-ek esetében érdemes figyelmeztetni a címzetteket, hogy tegyenek minket a fehér listára, azaz a biztonságos feladók közé. Így elkerülhetjük, hogy küldeményünk a levélszemétben landoljon, és sikeres kampányt bonyolíthatunk le.