MIT Information Retrieval_Question

The document discusses a spam filter using a Naïve Bayes classifier to evaluate the probability of an email being spam based on the presence of the word 'discount.' It calculates the total probability of the word 'discount' and then applies Bayes' Theorem to find that the probability of an email being spam given it contains 'discount' is 56.25%. The calculations show that 32% of all emails contain 'discount,' leading to the final probability result.

Uploaded by

Mohamed Sido

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

3 views2 pages

MIT Information Retrieval_Question

Uploaded by

Mohamed Sido

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

MIT Information Retrieval: Question

Name: MOHAMMED ABUSIDU

University: President University
Course: Information Retrieval
Instructor: HASANUL FAHMI

Question:

A spam filter uses a Naïve Bayes classifier to determine whether an email is spam based on the presence
of certain words. Suppose we have the following probabilities:

● P(Spam) = 0.3 (30% of all emails are spam)

● P(Not Spam) = 0.7 (70% of all emails are not spam)
● P("discount" | Spam) = 0.6 (60% of spam emails contain the word “discount”)
● P("discount" | Not Spam) = 0.2 (20% of non-spam emails contain the word “discount”)

If an email contains the word "discount," what is the probability that it is spam?

Answer:-

● Compute P(“discount”) (Total Probability of the Word "Discount")

P(“discount”) = P("discount"∣ Spam) * P(Spam)+P("discount"∣ Not Spam) * P(Not Spam)

= (0.6×0.3) + (0.2×0.7)

= 0.18 + 0.14= 0.32

This means that 32% of all emails contain the word "discount".

● Compute P(Spam ∣ "discount") Using Bayes' Theorem

𝑃("𝑑𝑖𝑠𝑐𝑜𝑢𝑛𝑡"∣𝑆𝑝𝑎𝑚)𝑃(𝑆𝑝𝑎𝑚)
P(Spam∣"discount") =
𝑃(“𝑑𝑖𝑠𝑐𝑜𝑢𝑛𝑡”)
(0.6×0.3) 0.18
= 0.32
= 0.32
= 0. 5625

The probability that an email is spam given that it contains the word "discount" is:

P(Spam∣"discount") = 0.5625 or 56.25%

Thank you.

Bai Tap Lon CLC
No ratings yet
Bai Tap Lon CLC
3 pages
Ba Yes I An Filtering
No ratings yet
Ba Yes I An Filtering
8 pages
Spam Filter Project Report
No ratings yet
Spam Filter Project Report
16 pages
Spam Filter Project Report
No ratings yet
Spam Filter Project Report
16 pages
Naive Bayes Algorithm Notes
No ratings yet
Naive Bayes Algorithm Notes
10 pages
Naive Bayes Classification - Elements of AI
No ratings yet
Naive Bayes Classification - Elements of AI
1 page
Supervised Learning: Naïve Bayes
No ratings yet
Supervised Learning: Naïve Bayes
15 pages
Week 3 - 5-Bayesian Methods
No ratings yet
Week 3 - 5-Bayesian Methods
4 pages
Naive Bayes Spam Classifier
0% (1)
Naive Bayes Spam Classifier
44 pages
Tran Thi Thuy Trang - OSTA2024 - Assign01
No ratings yet
Tran Thi Thuy Trang - OSTA2024 - Assign01
12 pages
Spam Filtering Using Bayesian Approach: Presented By: Nitin Kumar
No ratings yet
Spam Filtering Using Bayesian Approach: Presented By: Nitin Kumar
11 pages
Detecting Spam Mail With Naive Bayes
No ratings yet
Detecting Spam Mail With Naive Bayes
5 pages
Houdini Action Figure
No ratings yet
Houdini Action Figure
2 pages
Turning Data Into Probability
No ratings yet
Turning Data Into Probability
6 pages
Naive_Bayes_Classifier
No ratings yet
Naive_Bayes_Classifier
3 pages
mc180400708 - CS723 (1) solutionNN
No ratings yet
mc180400708 - CS723 (1) solutionNN
3 pages
Assignment 3 28855
No ratings yet
Assignment 3 28855
3 pages
Case 1
No ratings yet
Case 1
2 pages
Document
No ratings yet
Document
2 pages
Bayes Theorem(3)
No ratings yet
Bayes Theorem(3)
9 pages
Machine Learning Session: Naïve Bayes Classifier
No ratings yet
Machine Learning Session: Naïve Bayes Classifier
7 pages
Machine Learning Session: Naïve Bayes Classifier
No ratings yet
Machine Learning Session: Naïve Bayes Classifier
7 pages
A Plan For Spam
No ratings yet
A Plan For Spam
10 pages
ProbabilisticLearning Bayesian
No ratings yet
ProbabilisticLearning Bayesian
11 pages
Lec6 Parametricvsnonparametric
No ratings yet
Lec6 Parametricvsnonparametric
29 pages
Naive Bayes Classifier Overview
No ratings yet
Naive Bayes Classifier Overview
7 pages
Content Based Spam Detection in Email Us PDF
No ratings yet
Content Based Spam Detection in Email Us PDF
5 pages
Spam Filtering Algorithm
No ratings yet
Spam Filtering Algorithm
19 pages
AIML ASSIGNMENT-2
No ratings yet
AIML ASSIGNMENT-2
8 pages
Implementation of Naïve Bayesian Spam Filter Algorithm
No ratings yet
Implementation of Naïve Bayesian Spam Filter Algorithm
16 pages
Bayes Theorem Problems
No ratings yet
Bayes Theorem Problems
6 pages
Aayush Nihar Spam Mail Filtering
No ratings yet
Aayush Nihar Spam Mail Filtering
18 pages
Email Based Spam Detection
No ratings yet
Email Based Spam Detection
5 pages
Bayes theorem
No ratings yet
Bayes theorem
3 pages
Lec-6 Spam-1
No ratings yet
Lec-6 Spam-1
16 pages
Spam Detection Using BERT
No ratings yet
Spam Detection Using BERT
6 pages
2425s Csec520 08 Naive Bayes Knn
No ratings yet
2425s Csec520 08 Naive Bayes Knn
44 pages
07_KNN & Naive Bayes
No ratings yet
07_KNN & Naive Bayes
59 pages
NLP Naive Bayes Multinomial Classification
No ratings yet
NLP Naive Bayes Multinomial Classification
41 pages
Unit 2 Bayesian Learning Bayes Theorem and Bayes Optimal Classifier
No ratings yet
Unit 2 Bayesian Learning Bayes Theorem and Bayes Optimal Classifier
19 pages
Chapter 1: Bayesian Basics: Conchi Aus In and Mike Wiper Department of Statistics Universidad Carlos III de Madrid
No ratings yet
Chapter 1: Bayesian Basics: Conchi Aus In and Mike Wiper Department of Statistics Universidad Carlos III de Madrid
49 pages
Probabilistic Learning - NB
No ratings yet
Probabilistic Learning - NB
10 pages
Shobij Gautam 16033147 Spam Classification (Naïve Bayes) Assignment
No ratings yet
Shobij Gautam 16033147 Spam Classification (Naïve Bayes) Assignment
4 pages
$RB0DCAN
No ratings yet
$RB0DCAN
10 pages
Fraud Detection System: - Nikita Lawande - Prakarsha Dahat - Riya Thakur
No ratings yet
Fraud Detection System: - Nikita Lawande - Prakarsha Dahat - Riya Thakur
14 pages
Bayesian Filtering: Beyond Binary Classification
No ratings yet
Bayesian Filtering: Beyond Binary Classification
8 pages
Naive Bayes Classifier Notes
No ratings yet
Naive Bayes Classifier Notes
2 pages
Project 2: Spam Filtering: Linear Statistical Models SYS 4021
No ratings yet
Project 2: Spam Filtering: Linear Statistical Models SYS 4021
36 pages
Bayesian_Inference
No ratings yet
Bayesian_Inference
20 pages
Logistic Regression For Spam Filtering: Niclas Englesson
No ratings yet
Logistic Regression For Spam Filtering: Niclas Englesson
37 pages
Calculate conditional probability with Bayes
No ratings yet
Calculate conditional probability with Bayes
5 pages
Naive Bayes - An Example
No ratings yet
Naive Bayes - An Example
4 pages
An Example of Text Classification With Naïve Bayes
No ratings yet
An Example of Text Classification With Naïve Bayes
4 pages
CPP Report
No ratings yet
CPP Report
14 pages
Probabilistic Models based Problems [Autosaved]
No ratings yet
Probabilistic Models based Problems [Autosaved]
8 pages
Bayes Theorem Application
No ratings yet
Bayes Theorem Application
6 pages
Enhancing Email Security with Naïve Bayes Spam Detection.docx Fully edited
No ratings yet
Enhancing Email Security with Naïve Bayes Spam Detection.docx Fully edited
64 pages
Decision Tree Model For Email Classification: Ivana Čavor
No ratings yet
Decision Tree Model For Email Classification: Ivana Čavor
4 pages
Statistics
No ratings yet
Statistics
25 pages
MIT Information Retrieval_ Question_2_Mohammed_Abusidu
No ratings yet
MIT Information Retrieval_ Question_2_Mohammed_Abusidu
3 pages
Midterm Examination IR 2025
No ratings yet
Midterm Examination IR 2025
3 pages
ABUSIDU - MIT Information Retrieval_ Exercise 4
No ratings yet
ABUSIDU - MIT Information Retrieval_ Exercise 4
5 pages
Ilovepdf Merged
No ratings yet
Ilovepdf Merged
139 pages

MIT Information Retrieval_Question

Uploaded by

MIT Information Retrieval_Question

Uploaded by

MIT Information Retrieval: Question

Name: MOHAMMED ABUSIDU

●​ P(Spam) = 0.3 (30% of all emails are spam)

●​ Compute P(“discount”) (Total Probability of the Word "Discount")

P(“discount”) = P("discount"∣ Spam) * P(Spam)+P("discount"∣ Not Spam) * P(Not Spam)

​ ​ = 0.18 + 0.14= 0.32

●​ Compute P(Spam ∣ "discount") Using Bayes' Theorem

P(Spam∣"discount") = 0.5625 or 56.25%

You might also like

● P(Spam) = 0.3 (30% of all emails are spam)

● Compute P(“discount”) (Total Probability of the Word "Discount")

= 0.18 + 0.14= 0.32

● Compute P(Spam ∣ "discount") Using Bayes' Theorem