Klávesové zkratky na tomto webu - rozšířené Na obsah stránky

vytrženo z kontextu

50MB spamu a jedny Rolexky

Spam E-mailovou složku se spamem a viry mažu až po delší době. Abych náhodou nenávratně neodstranil něco důležitého. Spamový filtr SpamBayes sice funguje spolehlivě, ale je to také díky tomu, že většina „dobré“ pošty mi chodí v češtině, zatímco nabídky na delší sex se zvětšeným údem za poslechu tikotu hodinek Rolex bývají v jazyce anglickém. Takže filtr se někdy chybně snaží uchránit před mým zrakem i e-maily od Google či amerického kamaráda.

Antispamový vs. spamový filtr

Spam Trošku odbočím, ale právě mě trklo, jak spousta lidí používá termín Antispamový filtr. Vlastně většina (1270 : 1199)! Nejsem sice študovanej, ale selský rozum mi říká, že antispamový filtr je zařízení, které odfiltruje opak spamu a samotný spam propustí. K čemu je to dobré, vskutku nevím, ale rozhodně spíš doporučuji používat „spamové filtry“ :-)

Statistika nuda je

Statistika nuda je, má však cenné údaje. Než jsem smazal měsíc starou složku se spamy a viry (nepoužívám e-mailový antivir, spolehlivě jej nahradí spamfiltr), změřil jsem pár hodnot:

Spamů a virů za měsíc listopad 1135ks (32ks / den)
Objem 47MB (1,6MB / den)
Průměrná velikost 1 spamu 41kB

Podívejme se ještě na statistiky, které prezentuje filtr SpamBayes. Údaje jsou za 7 měsíců provozu, nicméně o prázdninách je e-mailů vždy méně, tedy můžeme je považovat za půlroční.

Přijato 11559 e-mailů
Označeno jako spam 66%
Označeno jako dobré 31%
Nebyl si jist 3%
Chybně považováno za spam 0,2%
Chybně označeno jako dobré 0,5% (odhadem)
Poměr spam:dobré 2:1

Nemít občasnou anglickou konverzaci, těch omylů by bylo mnohem méně. Na druhou stranu, zajímala by mě účinnost filtrů u Angličanů a Američanů.

Závěry

A v záveru našej relácie si urobíme volaké závery, hej? Spam

  • Bayesovský filtr je v českém prostředí vynikající
  • Spam tvoří zanedbatelný objem přenesených dat (u mě cca 5%)
  • Poměr spam/antispam není zas tak drtivý, jak jsem se domníval
  • SMS notifikace provedená před filtrováním je dobrá jen pro masochisty

Ale jde o výzkum provedený na jednom jediném vzorku, závěry jsou tedy neobjektivní. Proto bych vyzval čtenáře, zda by se mohli o podělit o své zkušenosti!

Karma body: 29. Líbil se vám článek?

Komentáře » přidat

  1. [1] kakoo: nový

    sms notifikaci mám před spam filtrem – ovšem jen maily, který jsou z .cz … málokdy přijde zahraniční spam s podvrhnutou adresou z .cz… a pokud si budu psát s někým z jiné domény, notifikaci oželím nebo udělám samotný filtr pro něj – mluvím ovšem o t-zones, nevím, jak moc jde nastavovat u ost. operátorů

    Posláno 1. 12. 2004 v 18.19 | Odpovědět
  2. [2] Jiří Bureš: nový

    Tak to se máš dobře. Já mám „užitečné“ pošty tak kolem 5 % – viz http://blog.converter.cz/index…

    Posláno 2. 12. 2004 ve 14.52 | Odpovědět
  3. [3] Hollyfood: nový

    Dejve, docela bych s tebou polemizoval, páč podle tvé definice by antivirové programy propouštěly viry a nezávadné zprávy naopak potíraly. Takže buď je tvá teorie mylná nebo jsou v omyl antivirové firmy (AVG jako takové je omyl v obou případech).

    Posláno 2. 12. 2004 v 15.47 | Odpovědět
    Na komentář reagoval [4] David Grudl
  4. avatar [4] David Grudl: nový

    [3] Hollyfood: jde o kombinaci předpony anti- a slova filtr. Prostě kávový filtr v překapávači zachytává kávu, prachový filtr zachytává prach, spamový filtr zachytává spam a co dělá antispamový filtr? Zachytává anti-spam. A spam propouští dál ;-)

    Posláno 2. 12. 2004 v 18.06 | Odpovědět
  5. [5] MaD: nový

    Čistě anglická pošta by měla být ve skutečnosti pro Bayesovské filtry stravitelnější, než takovýto mix, protože ho nebudou mást běžná anglická slova, která ve vaší poště znamenají vysokou pravděpodobnost spamu, zatímco u anglického uživatele budou nezajímavá.

    Posláno 4. 12. 2004 v 16.04 | Odpovědět
  6. [6] Jan Vaněk jr.: nový

    Sice taky nejsem studovaný, ale produktivní přípona -ový má rozhodně víc významů než „na X“. Rozhodně dám přednost protitetanové injekci před tetanovou.

    Posláno 7. 12. 2004 ve 13.20 | Odpovědět
    Na komentář reagoval [7] David Grudl
  7. avatar [7] David Grudl: nový

    [6] Jan Vaněk jr.: jsem si to ale zavařil, ač byla poznámka o antiXXX filtru myšlena jako vtípek, teď abych ji obhajoval v každém druhém komentáři ;-)

    Posláno 7. 12. 2004 ve 20.32 | Odpovědět
  8. avatar [8] Jakub: nový

    Dobrý den.
    Nejsem žádný IT profesionál.
    Mám jen jednoduchou otázku:
    mb znamená megabit, megabyte nebo MalýBordel?

    Ve školce nám vychovatelky říkaly, že:
    MB je megabajt
    Mb je megabit
    ale s mb je pro mne absolutní novinka.

    Předem děkuji za odtajnění záhadné zkratky

    Posláno 12. 12. 2004 v 1.09 | Odpovědět
    Na komentář reagoval [9] David Grudl
  9. avatar [9] David Grudl: nový

    [8] Jakub: mb? to bude nejspíš Mladá Boleslav, ale ještě to ověřím :-)

    Posláno 12. 12. 2004 ve 13.13 | Odpovědět
    Na komentář reagoval [10] Jakub
  10. avatar [10] Jakub: nový

    [9] David Grudl: už vím !!

    mb=malý bobeš :-)

    nebo něco více počítačového?

    Posláno 13. 12. 2004 v 19.15 | Odpovědět
  11. avatar [11] frantisek: nový

    chodi mi 18 spamu denne (prumer), nejvice 30.11. (34ks)
    i u me jde o zanedbatelne procento prenesenych dat, hlavni cast objemu tvori :-) pps a ppt
    antispamovy filtr jsem pochopil – chyta nespamy, pousti spamy. je to tak?
    a jako pocitacovy neodbornik chapu, ze mluvi li nekdo o objemu prenesenych dat, je velmi nepravdepodobne, ze by ho uvadel v megabitech , ze

    Posláno 14. 12. 2004 ve 23.32 | Odpovědět
    Na komentář reagoval [12] David Grudl
  12. avatar [12] David Grudl: nový

    [11] frantisek: Jakub má pravdu v tom, že jsem použil špatnou jednotku. A donutil mě tím si konečně zjistit, jak se to správně píše. Teď už jsou jednotky ve článku a nadpisu opravené.

    Jinak zjišťuji, že dlouhodobé statistiky SpamBayes jsou mnohem pozitivnější, než co ukazuje denní praxe. Toho spamu je mnohem větší procento…

    Posláno 15. 12. 2004 v 8.40 | Odpovědět
  13. avatar [13] Mark: nový

    Myslim ze zrovna na TE strance to maji popsane docela blbe. … mrkni radsi na wikipedii :-) … spravne bys mel mit v clanku jednodku MiB (megabinarybyte – zkracene mebibyte) :-)

    Posláno 14. 7. 2006 ve 21.26 | Odpovědět

Tento článek byl uzavřen. Už není možné k němu přidávat komentáře ani hlasovat

Výtah na začátek článku na první komentář

Názory čtenářů v diskusích nejsou názory provozovatele webu, a ten za jejich obsah neodpovídá.

La Trine © 2004, 2008 David Grudl – o webu
provozuje Pachollini.

Jakékoliv užití obsahu, včetně převzetí článků nebo jejich částí, je bez předchozího písemného svolení autora zakázáno.

Ukázky zdrojových kódů smíte používat s uvedením autora a URL tohoto webu bez dalších omezení.