المصنف بايز ساذج

المصنف البايزي الساذج قالب:إنج هي عائلة من المصنفات الاحتمالية البسيطة على أساس تطبيق نظرية بايز مع افتراضات استقلالية (ساذجة) قوية بين الميزات.[١][٢] هم من أبسط نماذج شبكة بايز. ولكن يمكن أن يقترن بتقدير كثافة النواة و تحقيق مستويات دقة أعلى.[٢] هذه الخوارزمية نموذج مصنف توليدي قالب:إنج.[٣][٤] تمت دراسة بايز ساذج على نطاق واسع منذ الستينيات. تم إدخاله (على الرغم من أنه ليس تحت هذا الاسم) في مجتمع استرجاع المعلومات في أوائل الستينيات، ولا يزال طريقة شائعة لتصنيف النص.[١]
نظرية
بشكل عام، خوارزمية بايز ساذج هي نموذج احتمال شرطي: افترض أننا نريد تصنيف مثال جديد يسمى ، والذي يحتوي على n متغيرات (المتغيرات المستقلة). وافترض أن لدينا K تصنيفات. يتم احتساب احتمال أن ينتمي هذا المثال إلى تصنيف Ck على النحو التالي:
باستخدام نظرية بايز ، يمكن إعادة كتابة الاحتمال الشرطي على النحو التالي:
لقد افترضنا بالفعل أن المتغيرات مستقلة. لذا، يمكننا إعادة كتابة هذا الاحتمال بضرب n من الاحتمالات.