0% found this document useful (0 votes)

16 views4 pages

DWM Practical

The document discusses two programs related to data cleaning and analysis techniques. The first program implements data smoothing using binning techniques like mean, median and boundaries. The second program calculates measures of central tendency like mean, median, mode, calculates five number summary and identifies outliers.

Uploaded by

kirtanpatel6365

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

16 views4 pages

DWM Practical

Uploaded by

kirtanpatel6365

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 4

200410116027 TY-IT-2-C

PRACTICAL-1

AIM:Write a program which implements-“Data Cleaning” Smoothing by

binning techniques mean, median and boundaries.

INPUT:

import numpy as np
import math
from sklearn.datasets import load_iris
from sklearn import datasets, linear_model, metrics

# load iris data set

dataset = load_iris()
a = dataset.data
b =np.zeros(150)

# take 1st column among 4 column of data set

for i in range (150):
b[i]=a[i,1]
b=np.sort(b)

# create bins
bin1=np.zeros((30,5))
bin2=np.zeros((30,5))
bin3=np.zeros((30,5))

# Bin mean
for i in range (0,150,5):
k=int(i/5)
mean=(b[i] + b[i+1] + b[i+2] + b[i+3] + b[i+4])/5
for j in range(5):
bin1[k,j]=mean
print("Smoothing by Bin Mean: \n",bin1)

# Bin boundaries
for i in range (0,150,5):
k=int(i/5)
for j in range (5):

SVIT 1
200410116027 TY-IT-2-C

if (b[i+j]-b[i]) < (b[i+4]-b[i+j]):

bin2[k,j]=b[i]
else:
bin2[k,j]=b[i+4]
print("Smoothing by Bin Boundaries: \n",bin2)

# Bin median
for i in range (0,150,5):
k=int(i/5)
for j in range (5):
bin3[k,j]=b[i+2]
print("Smoothing by Bin Median: \n",bin3)

OUTPUT:

Sorted data for price (in dollars): 4, 8, 9, 15, 21, 21, 24,
25, 26, 28, 29, 34
Partition using equal frequency approach:

- Bin 1 : 4, 8, 9, 15
- Bin 2 : 21, 21, 24, 25
- Bin 3 : 26, 28, 29, 34
Smoothing by bin means:

SVIT 2
200410116027 TY-IT-2-C

PRACTICAL-2

AIM: Write a program for “central tendency of data”to calculate mean,

median, mode, midrange and five number summary.

INPUT:

import statistics
import matplotlib.pyplot as plt
import numpy as np

data=[13 , 15, 16, 16, 19, 20, 20, 21, 22, 22, 22, 25, 25, 25, 25, 30, 33, 33,
35, 35, 35, 35, 36, 40, 45, 46, 53, 70]
print(data)
print("mean of given data %s"%(statistics.mean(data)))
print("median of given data %s"%(statistics.median(data)))
print("mode of given data %s" %(statistics.mode(data)))

min=np.min(data)
print("min value of given data", min)

max=np.max(data)
print("max value of given data",max)

Q1=np.percentile(data,25)
print("Q1 is" ,Q1)

Q2=np.percentile(data, 50)
print("Q2 is" ,Q2)

Q3=np.percentile(data,75)
print("Q3 is",Q3)

IQR=(Q3 - Q1)
print("IQR is",IQR)

midrange=(max-min)/2
print("midrange is ",midrange)

out = 1.5*IQR

SVIT 3
200410116027 TY-IT-2-C

lb=Q1-out
ub=Q3+out
outliers=[]
for i in data:
if i<lb:
outliers.append(i)
elif i>ub:
outliers.append(i)
print("outliers is",outliers)

fig = plt.figure(figsize =(8, 5))

plt.boxplot(data)
plt.show()

OUTPUT:

- Bin 2: 23, 23, 23, 23

- Bin 3: 29, 29, 29, 29
Smoothing by bin boundaries:

- Bin 1: 4, 4, 4, 15

SVIT 4

Academic Performance in Math and Science-Related Subjects of Grade 12 Students in Relation To Class Schedules
No ratings yet
Academic Performance in Math and Science-Related Subjects of Grade 12 Students in Relation To Class Schedules
26 pages
Stastistics and Probability With R Programming Language: Lab Report
50% (2)
Stastistics and Probability With R Programming Language: Lab Report
44 pages
Janus Faces
100% (1)
Janus Faces
8 pages
Data Discretization
No ratings yet
Data Discretization
32 pages
DWDM Lab Manual
No ratings yet
DWDM Lab Manual
32 pages
DM Lab
No ratings yet
DM Lab
41 pages
Script Freshmen Orientation
100% (1)
Script Freshmen Orientation
5 pages
Data Mining Presentation
No ratings yet
Data Mining Presentation
206 pages
Lec 6 Data Preprocessing using R
No ratings yet
Lec 6 Data Preprocessing using R
84 pages
02 Pre Processing
No ratings yet
02 Pre Processing
52 pages
Binnnig Using Python (2)
No ratings yet
Binnnig Using Python (2)
2 pages
DWM_EXP-3
No ratings yet
DWM_EXP-3
3 pages
DWM exp 3.1
No ratings yet
DWM exp 3.1
4 pages
Data processing_unit-3
No ratings yet
Data processing_unit-3
38 pages
DWM Practical 113
No ratings yet
DWM Practical 113
24 pages
03-data-preparation
No ratings yet
03-data-preparation
41 pages
Topic 05 - Data Preprocessing
No ratings yet
Topic 05 - Data Preprocessing
62 pages
PS2 Sol
No ratings yet
PS2 Sol
7 pages
Unit-1 3
No ratings yet
Unit-1 3
58 pages
Week2_DataPreprocessing
No ratings yet
Week2_DataPreprocessing
43 pages
Lecture5
No ratings yet
Lecture5
27 pages
Unit 2
No ratings yet
Unit 2
46 pages
DWDM_Lecture_ppt_Unit3_Part3
No ratings yet
DWDM_Lecture_ppt_Unit3_Part3
29 pages
Part 3
No ratings yet
Part 3
8 pages
DM Lab Internal
No ratings yet
DM Lab Internal
37 pages
9-Tutorials-31-07-2024
No ratings yet
9-Tutorials-31-07-2024
28 pages
DSR Unit III
No ratings yet
DSR Unit III
11 pages
Lecture 7 -Data Preprocessing - Cleaning-M
No ratings yet
Lecture 7 -Data Preprocessing - Cleaning-M
21 pages
Lecture 5 # Effective Data Denoising Techniques
No ratings yet
Lecture 5 # Effective Data Denoising Techniques
18 pages
5 Data Preprocessing III Editted Notes
No ratings yet
5 Data Preprocessing III Editted Notes
17 pages
DWDM UNIT-II
No ratings yet
DWDM UNIT-II
18 pages
SEC1
No ratings yet
SEC1
7 pages
Data Mining
No ratings yet
Data Mining
31 pages
binning-1
No ratings yet
binning-1
3 pages
Guay Motivation Scale
75% (4)
Guay Motivation Scale
5 pages
DM-2Preprocessing 2
No ratings yet
DM-2Preprocessing 2
61 pages
Rooter
No ratings yet
Rooter
4 pages
Timing Belt PDF
No ratings yet
Timing Belt PDF
4 pages
DALI
No ratings yet
DALI
162 pages
Experiment 3
No ratings yet
Experiment 3
8 pages
Data Manipulation With Numpy
No ratings yet
Data Manipulation With Numpy
13 pages
DWDM Lab Manual 28.04.25-9-14
No ratings yet
DWDM Lab Manual 28.04.25-9-14
6 pages
UNIT-2
No ratings yet
UNIT-2
34 pages
Binning
No ratings yet
Binning
6 pages
Formulario
No ratings yet
Formulario
7 pages
TQM Module 1
100% (5)
TQM Module 1
36 pages
GEC PRACTICALS
No ratings yet
GEC PRACTICALS
31 pages
Final - Unit 3 Data Preprocessing - Phases
No ratings yet
Final - Unit 3 Data Preprocessing - Phases
42 pages
Updated, 01.06.13 RESUME Prof - Tushar T.shelke
No ratings yet
Updated, 01.06.13 RESUME Prof - Tushar T.shelke
9 pages
Show Your Work in Detail: 1. Given The Following Data
No ratings yet
Show Your Work in Detail: 1. Given The Following Data
6 pages
Vandana Resume 2003 Marketing
No ratings yet
Vandana Resume 2003 Marketing
3 pages
DAV Practicals
No ratings yet
DAV Practicals
26 pages
Feature Engineering
No ratings yet
Feature Engineering
35 pages
New Algebra by Ajay Rana Sir PDF
No ratings yet
New Algebra by Ajay Rana Sir PDF
16 pages
Vanshika Goyal Gec Practicals
No ratings yet
Vanshika Goyal Gec Practicals
31 pages
Lec2 - Data Preprocessing
No ratings yet
Lec2 - Data Preprocessing
30 pages
Paper - Windowless Shadow Snapshots
No ratings yet
Paper - Windowless Shadow Snapshots
25 pages
Week2-2
No ratings yet
Week2-2
25 pages
Unit-2 Lecture Notes
No ratings yet
Unit-2 Lecture Notes
33 pages
Gallaeformans Ditylenchus Sp.
No ratings yet
Gallaeformans Ditylenchus Sp.
18 pages
Exp 5
No ratings yet
Exp 5
11 pages
DepEd Form
100% (3)
DepEd Form
16 pages
Dal Programs With Output
No ratings yet
Dal Programs With Output
11 pages
pp DWDM 4 5
No ratings yet
pp DWDM 4 5
26 pages
Slide 2 - Data Preprocessing
100% (1)
Slide 2 - Data Preprocessing
39 pages
4 Binning
No ratings yet
4 Binning
19 pages
Binning
No ratings yet
Binning
5 pages
Entropy Discretization
No ratings yet
Entropy Discretization
20 pages
One Bear Lost
No ratings yet
One Bear Lost
3 pages
Exercises and Applications For Microeconomic Analysis PDF
0% (2)
Exercises and Applications For Microeconomic Analysis PDF
2 pages
Solving System of Linear Equations: Y. Sharath Chandra Mouli
No ratings yet
Solving System of Linear Equations: Y. Sharath Chandra Mouli
32 pages
Reasoning Notes For Ugc Net Paper 1
90% (10)
Reasoning Notes For Ugc Net Paper 1
56 pages
100 Puzzles
No ratings yet
100 Puzzles
97 pages
16 Personality Types
No ratings yet
16 Personality Types
3 pages
Lesson Plan Social Studies - ECONOMICS Subject Topic Year Level Time Objectives
No ratings yet
Lesson Plan Social Studies - ECONOMICS Subject Topic Year Level Time Objectives
3 pages
OUAT Post Graduate
No ratings yet
OUAT Post Graduate
44 pages
Bates Ferri
No ratings yet
Bates Ferri
20 pages
Solution Manual For Modern Flight Dynamics by Schmidt
0% (1)
Solution Manual For Modern Flight Dynamics by Schmidt
19 pages
Finney, Ben - Nautical Cartography and Traditional Navigation in Oceania
No ratings yet
Finney, Ben - Nautical Cartography and Traditional Navigation in Oceania
50 pages
Title Proposal Format
No ratings yet
Title Proposal Format
2 pages
Data Pre Processing - NG
No ratings yet
Data Pre Processing - NG
43 pages
CG Carpentry For Grades 7-10
100% (1)
CG Carpentry For Grades 7-10
13 pages
Homework Index: To See If The Questions Have Been Changed, or If You Are Required To Use Different Data or Examples
No ratings yet
Homework Index: To See If The Questions Have Been Changed, or If You Are Required To Use Different Data or Examples
86 pages
4 - Finding and Fixing Data Quality Issues
No ratings yet
4 - Finding and Fixing Data Quality Issues
48 pages
Information: Reading Images - The Grammar of Visual Design
No ratings yet
Information: Reading Images - The Grammar of Visual Design
5 pages
Grade 10 English
No ratings yet
Grade 10 English
6 pages
Language Test 2A : Grammar
No ratings yet
Language Test 2A : Grammar
4 pages
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
Advanced C Concepts and Programming: First Edition
From Everand
Advanced C Concepts and Programming: First Edition
Gayatri
3/5 (1)
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet

DWM Practical

Uploaded by

DWM Practical

Uploaded by

200410116027 TY-IT-2-C

AIM:Write a program which implements-“Data Cleaning” Smoothing by

# load iris data set

# take 1st column among 4 column of data set

if (b[i+j]-b[i]) < (b[i+4]-b[i+j]):

AIM: Write a program for “central tendency of data”to calculate mean,

fig = plt.figure(figsize =(8, 5))

- Bin 2: 23, 23, 23, 23

You might also like