څه شی ته اړتیا لرئ د Bayesian Spam فلټر کولو په اړه

ومومئ چې احصایه ستاسو د انبکس پاکولو کې مرسته کوي

د بيیسین سپام فلټر د هغې د محتوا پر بنسټ د پیغام پیغام سپیم حسابوي. د ساده محتوياتو پر بنسټ فلټرونه، د بيیسین سپیم فلټر کولو له سپیم او د بریښناليک څخه زده کړه کوي، چې پایله یې د سپیم ضد ضد خورا خورا پیاوړی، تطبیق او اغیزناک چلند دی چې، له ټولو څخه غوره، په ناڅاپي توګه کوم غلط مثبت بیرته راستنیږي.

تاسو د جنک برېښنالیک څنګه پیژني؟

په دې اړه فکر وکړئ چې تاسو سپیم څنګه موندلی شئ. یو چټک نظر اکثرا کافی دی. تاسو پوهیږئ چې سپیم څه ډول ښکاري، او تاسو پوهیږئ چې ښه میلم څنګه ښکاري.

د سپم لیدلو امکانات لکه ښې میلې ... صفر دي.

د سکټور د توکو پر بنسټ فلټرونه تطبیق نه کوي

ایا دا به ښه نه وي که چیرې د اتوماتیک سپیم فلټرونه هم ورته کار کاوه؟

د محتویاتو پر بنسټ د سپیم فلټرونو ډیریدل یوازې دا هڅه کوي. دوی د سپیم په پرتله د کلمو او نورو ځانګړتیاو په لټه کې دي. هر ځانګړتیا عنصر یو ګمارل شوی دی، او د ټول پیغام لپاره سپیم سکور د انفرادي کچې څخه راټول شوی دی. ځینې ​​سټریټ فلټونه د مشروع پوست ځانګړتیاو ته هم ګوري، د پیغام وروستی سکور کم کوي.

د فلټر کولو طریقه کار کوي، مګر دا هم ډیری نیمګړتیاوې لري:

د بیسیسین سپیم فلټرونه غوره کول، ښه او غوره کول

د بيیسین سپیم فلټر یو ډول ډیزاین د منځپانګې پر بنسټ ولاړ فلټرونه هم دي. د دوی تګلاره د ساده سپیم فلټرونو د مشکلاتو سره مخ کیږي، که څه هم، او دا په بنسټیز ډول ترسره کوي. څرنګه چې د فلټرونو کمولو کمزوری په مینځل شوي جوړ شوي لیست کې د ځانګړتیاوو او د دوی شمیرونو کې دی، دا لیست ختم شوی.

پرځای یې، د بيیسین سپیم فلټر ځان لیست جوړ کړ. په عین حال کې، تاسو د یو لوی (لوی) ډلی سره پیل کړئ چې تاسو یې د سپیم په توګه طبقه بندي کړې، او د ښې برېښناليک بله ډله. فلټر دواړه دواړه ګوري او قانوني مشروع او سپام تجزیه کړي چې د مختلفو ځانګړتیاوو احتمال په سپیم کې ښکاري، او په بریښنالیک کې.

څنګه د بيیسین سپیم فلټر یو بریښنالیک معاینه کوي

د بیزسین سپام فلټر ځانګړتیاوې کولی شي چې وي:

که یو کلمه، "کارټیسین" د مثال په توګه، په سپیم کې هیڅکله نه لیدل کیږي مګر اکثرا په مشروع بریښنالیک کې چې تاسو ترلاسه کوئ، احتمال لري چې "کارټیسین" سپیم څرګندوي صفر ته نږدې وي. له بلې خوا، ټونر په ځانګړې توګه، او ځینې وختونه په سپیم کې ښکاري. "ټونر" د سپیم په موندلو کې خورا لوی امکان لري، نه ډیر ټیټ (1٪).

کله چې یو نوی پیغام راغی، دا د بییسین سپام فلټر لخوا تحلیل شوی، او د بشپړ پیغام سپیم احتمال د انفرادي ځانګړتیاوو په کارولو سره محاسبه کیږي.

فرض کړئ چې پیغام "Cartesian" او "toner" دواړه شامل وي. یوازې له دغو کلمو څخه دا روښانه نه ده چې آیا موږ سپیم یا قانوني لیک لرو که نه. نور ځانګړتیاوې به (امید لري او ډیر احتمال ولري) امکان لري چې فلټر ته پیغام پیغام ورکړي چې پیغام یې سپیم یا ښه بریښناليک وي.

د بیزیسین سپیم فلټرونه پخپل ځان زده کولی شي

اوس چې موږ یو طبقه بندی لرو، پیغام کولی شي د فلټر ځان نور روزلو لپاره وکارول شي. په دې حالت کې، یا د "کارټیسین" احتمال د ښه بریښناليک ښکارندوی دی) که چیرې پیغام "کارټیسین" او "ټریر" دواړه سپیم وي، یا د "ټونر" احتمال د سپیم څرګندولو ته اړتیا وي.

د دې اتفیکیکیک تخنیک کارولو څخه، د بییسینین فلټر کولی شي د دوی او د دوی د پریکړو څخه زده کړي ) (که چیرې هغه په ​​فلسفه کې په سمه توگه د غلطۍ سمه بڼه). د بیسیان فلټر کولو تطبیق دا هم ډاډه کوي چې د انفرادي بریښناليک کاروونکي لپاره خورا اغیزناک دي. پداسې حال کې چې ډیری خلک سپیم ممکن ورته ځانګړتیاوې ولري، مشروع میل د ځانګړو لپاره د ځانګړتیاوو سره توپیر لري.

څنګه کولی شي د تیر بییسینین فلټرونه ترلاسه کړي؟

د قانوني میلونو ځانګړتیاوې د بیسین سپیم فلټر کولو پروسې لپاره د سپیم په څیر مهم دي. که فلټر په ځانګړې توګه د هر کارونکي لپاره وروزل شي، سپیمر به د هرڅوک) یا حتی د ډیرو خلکو د سپیم فلټر (شاوخوا فلټر کار کوي، او فلټر کولی شي د هرې سپیمر هڅې هڅه وکړي.

سپیمران به یواځې دا ښه تجربه کړي بییسیسین فلټر کړي که چیرې دوی د سپیم پیغامونه په عادلانه بریښنالیک کې هرڅوک ترلاسه کړي لکه په بشپړ ډول لیدل کیږي.

سپیمر معمولا داسې عادي برېښنالیکونه نه راولي. راځئ چې دا فکر وکړو ځکه چې دا برېښنالیک د جنټ بریښنالیک په توګه کار نه کوي. نو، امکانات دا دي چې کله به عادي، بورډ ای میلونه د سپیم فلټرونو د جوړولو لپاره یوازینۍ لار وي.

که چیرې سپیمر زیاتره عادي عیار برېښناليکونو ته لاړ شي، په هرصورت، موږ به زموږ په ان باکسونو کې ډیر سپیم وګورئ، او بریښنالیک به د بیوسین ورځې څخه مخکې وي لکه څنګه چې دا وه) یا حتی بدتر (. دا به د ډیری ډول سپام لپاره بازار ویجاړ کړي، که څه هم، او دا به د اوږدې مودې لپاره پای ته ونه رسیږي.

قوي شاخصونه د بيیسین سپیم فلټر د آیلیلس کیدای شي. هیل

یو استثناء د سپیمرانو لپاره په پام کې نیول کیدی شي چې د بییسین فلټرونو له لارې حتی د دوی د معمول محتوياتو سره کار وکړي. دا د بایسان د شمیرو په فطرت کې دی چې یوه کلمه یا ځانګړتیا چې په ښې میلې کې ډیر ځلې لیدل کیدی شي خورا مهم وي ځکه چې د پیغام سپیم څخه د فلټر په واسطه د مس په توګه یو څه پیغام بدل کړي.

که چیرې سپیمر ستاسو د ډاډ یقیني کولو لپاره لاره ومومي - د بریښناليک بریښنالیکونه - د HTML بیرته ترالسه کولو رسیدونو کارولو په واسطه د دې لپاره وګورئ چې کوم پیغامونه تاسو تاسیس کړي، د مثال په توګه - دوی کېداې شي یو د دوی په جینک کې شامل وي او حتی د څاه ګانو له لارې تاسو ته ورسیږي، د بایسینان فلټر شوی.

جان ګیامام-کامنګ د دې لپاره هڅه وکړه چې د بیوسین فلټر کار د یو بل په وړاندې کار وکړي، "خراب" یو یې د "ښه" فلټر له لارې ترلاسه کولو پیغامونو موندلو سره یوځای کول. هغه وایي چې دا کار کوي، سره له دې چې دا بهیر وخت نیسي او پیچلي دي. موږ فکر نه کوو چې موږ به د دې پیښې ډیره برخه وګورو، لږترلږه په لویه پیمانه نه وي، او د افرادو د برېښناليک ځانګړتیاو سره سمون نه خوري. سپیمر کولی شي د سازمانونو لپاره ځینې کلیدي ټکي معلوم کړي) د مثال په ډول "Almaden" د ځینې خلکو لپاره IBM کې شاید شاید؟).

عموما، سپیم به تل (مهم) د منظم منظم لیست څخه وي یا دا سپیم نه وي، که څه هم.

لاندینۍ کرښه: د بایسینین فلټر کول د هغې ضیاع کولی شي

د بيیسین سپام فلټر د منځپانګې پر بنسټ فلټر دي چې: