0% found this document useful (0 votes)

5 views

Quality Prediction

Uploaded by

Pavan Kumar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views

Quality Prediction

Uploaded by

Pavan Kumar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 20

# importing libraries

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn import preprocessing
from sklearn.preprocessing import LabelEncoder
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from sklearn.metrics import confusion_matrix
from sklearn.linear_model import LogisticRegression
from sklearn.tree import DecisionTreeClassifier
from sklearn import svm
from sklearn import metrics

import warnings
warnings.filterwarnings('ignore')

# Loding the dataset

df = pd.read_csv('QualityPrediction.csv')
df

fixed acidity volatile acidity citric acid residual sugar

chlorides \
0 7.4 0.700 0.00 1.9
0.076
1 7.8 0.880 0.00 2.6
0.098
2 7.8 0.760 0.04 2.3
0.092
3 11.2 0.280 0.56 1.9
0.075
4 7.4 0.700 0.00 1.9
0.076
... ... ... ... ...
...
1594 6.2 0.600 0.08 2.0
0.090
1595 5.9 0.550 0.10 2.2
0.062
1596 6.3 0.510 0.13 2.3
0.076
1597 5.9 0.645 0.12 2.0
0.075
1598 6.0 0.310 0.47 3.6
0.067

free sulfur dioxide total sulfur dioxide density pH

sulphates \
0 11.0 34.0 0.99780 3.51
0.56
1 25.0 67.0 0.99680 3.20
0.68
2 15.0 54.0 0.99700 3.26
0.65
3 17.0 60.0 0.99800 3.16
0.58
4 11.0 34.0 0.99780 3.51
0.56
... ... ... ... ...
...
1594 32.0 44.0 0.99490 3.45
0.58
1595 39.0 51.0 0.99512 3.52
0.76
1596 29.0 40.0 0.99574 3.42
0.75
1597 32.0 44.0 0.99547 3.57
0.71
1598 18.0 42.0 0.99549 3.39
0.66

alcohol quality
0 9.4 5
1 9.8 5
2 9.8 5
3 9.8 6
4 9.4 5
... ... ...
1594 10.5 5
1595 11.2 6
1596 11.0 6
1597 10.2 5
1598 11.0 6

[1599 rows x 12 columns]

# Checking for null values

df.isnull().sum()

fixed acidity 0
volatile acidity 0
citric acid 0
residual sugar 0
chlorides 0
free sulfur dioxide 0
total sulfur dioxide 0
density 0
pH 0
sulphates 0
alcohol 0
quality 0
dtype: int64

df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1599 entries, 0 to 1598
Data columns (total 12 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 fixed acidity 1599 non-null float64
1 volatile acidity 1599 non-null float64
2 citric acid 1599 non-null float64
3 residual sugar 1599 non-null float64
4 chlorides 1599 non-null float64
5 free sulfur dioxide 1599 non-null float64
6 total sulfur dioxide 1599 non-null float64
7 density 1599 non-null float64
8 pH 1599 non-null float64
9 sulphates 1599 non-null float64
10 alcohol 1599 non-null float64
11 quality 1599 non-null int64
dtypes: float64(11), int64(1)
memory usage: 150.0 KB

df.describe()

fixed acidity volatile acidity citric acid residual sugar \

count 1599.000000 1599.000000 1599.000000 1599.000000
mean 8.319637 0.527821 0.270976 2.538806
std 1.741096 0.179060 0.194801 1.409928
min 4.600000 0.120000 0.000000 0.900000
25% 7.100000 0.390000 0.090000 1.900000
50% 7.900000 0.520000 0.260000 2.200000
75% 9.200000 0.640000 0.420000 2.600000
max 15.900000 1.580000 1.000000 15.500000

chlorides free sulfur dioxide total sulfur dioxide

density \
count 1599.000000 1599.000000 1599.000000
1599.000000
mean 0.087467 15.874922 46.467792
0.996747
std 0.047065 10.460157 32.895324
0.001887
min 0.012000 1.000000 6.000000
0.990070
25% 0.070000 7.000000 22.000000
0.995600
50% 0.079000 14.000000 38.000000
0.996750
75% 0.090000 21.000000 62.000000
0.997835
max 0.611000 72.000000 289.000000
1.003690

pH sulphates alcohol quality

count 1599.000000 1599.000000 1599.000000 1599.000000
mean 3.311113 0.658149 10.422983 5.636023
std 0.154386 0.169507 1.065668 0.807569
min 2.740000 0.330000 8.400000 3.000000
25% 3.210000 0.550000 9.500000 5.000000
50% 3.310000 0.620000 10.200000 6.000000
75% 3.400000 0.730000 11.100000 6.000000
max 4.010000 2.000000 14.900000 8.000000

df.head(5)

fixed acidity volatile acidity citric acid residual sugar

chlorides \
0 7.4 0.70 0.00 1.9
0.076
1 7.8 0.88 0.00 2.6
0.098
2 7.8 0.76 0.04 2.3
0.092
3 11.2 0.28 0.56 1.9
0.075
4 7.4 0.70 0.00 1.9
0.076

free sulfur dioxide total sulfur dioxide density pH sulphates

\
0 11.0 34.0 0.9978 3.51 0.56

1 25.0 67.0 0.9968 3.20 0.68

2 15.0 54.0 0.9970 3.26 0.65

3 17.0 60.0 0.9980 3.16 0.58

4 11.0 34.0 0.9978 3.51 0.56

alcohol quality
0 9.4 5
1 9.8 5
2 9.8 5
3 9.8 6
4 9.4 5

Data Preprocessing
df['quality'].value_counts()

5 681
6 638
7 199
4 53
8 18
3 10
Name: quality, dtype: int64

sns.catplot(x='quality', data=df, kind='count')

<seaborn.axisgrid.FacetGrid at 0x152b9301c10>
plot=plt.figure(figsize=(5,5))
sns.barplot(x='quality',y='volatile acidity',data=df)

<AxesSubplot:xlabel='quality', ylabel='volatile acidity'>

plot=plt.figure(figsize=(5,5))
sns.barplot(x='quality',y='citric acid',data=df)

<AxesSubplot:xlabel='quality', ylabel='citric acid'>

plt.bar(df['quality'], df['alcohol'])
plt.xlabel('quality')
plt.ylabel('alcohol')
plt.show()
Exploratory Data Analysis
df['quality'] = df['quality'].apply(lambda x: 1 if x >= 7 else 0)
df.rename(columns={'quality': 'good quality'}, inplace=True)
df.head()

fixed acidity volatile acidity citric acid residual sugar

chlorides \
0 7.4 0.70 0.00 1.9
0.076
1 7.8 0.88 0.00 2.6
0.098
2 7.8 0.76 0.04 2.3
0.092
3 11.2 0.28 0.56 1.9
0.075
4 7.4 0.70 0.00 1.9
0.076

free sulfur dioxide total sulfur dioxide density pH sulphates

\
0 11.0 34.0 0.9978 3.51 0.56
1 25.0 67.0 0.9968 3.20 0.68

2 15.0 54.0 0.9970 3.26 0.65

3 17.0 60.0 0.9980 3.16 0.58

4 11.0 34.0 0.9978 3.51 0.56

alcohol good quality

0 9.4 0
1 9.8 0
2 9.8 0
3 9.8 0
4 9.4 0

plt.figure(figsize=(5,5))
sns.countplot(x='good quality', data=df)
plt.xlabel('good quality')
plt.ylabel('Count')
plt.title('Count of Good vs Bad Quality Wines')
plt.show()
plt.figure(figsize=(10,6))
sns.heatmap(df.corr(), annot=True)
plt.show()

fig, ax = plt.subplots(2,4,figsize=(20,20))
sns.scatterplot(x = 'fixed acidity', y = 'citric acid', hue = 'good
quality', data = df, ax=ax[0,0])
sns.scatterplot(x = 'volatile acidity', y = 'citric acid', hue = 'good
quality', data = df, ax=ax[0,1])
sns.scatterplot(x = 'free sulfur dioxide', y = 'total sulfur dioxide',
hue = 'good quality', data = df, ax=ax[0,2])
sns.scatterplot(x = 'fixed acidity', y = 'density', hue = 'good
quality', data = df, ax=ax[0,3])
sns.scatterplot(x = 'fixed acidity', y = 'pH', hue = 'good quality',
data = df, ax=ax[1,0])
sns.scatterplot(x = 'citric acid', y = 'pH', hue = 'good quality',
data = df, ax=ax[1,1])
sns.scatterplot(x = 'chlorides', y = 'sulphates', hue = 'good
quality', data = df, ax=ax[1,2])
sns.scatterplot(x = 'residual sugar', y = 'alcohol', hue = 'good
quality', data = df, ax=ax[1,3])
<AxesSubplot:xlabel='residual sugar', ylabel='alcohol'>

Train Test Split

X_train, X_test, y_train, y_test = train_test_split(df.drop('good
quality', axis=1), df['good quality'], test_size=0.3, random_state=42)

X_train.head()

fixed acidity volatile acidity citric acid residual sugar

chlorides \
925 8.6 0.22 0.36 1.9
0.064
363 12.5 0.46 0.63 2.0
0.071
906 7.2 0.54 0.27 2.6
0.084
426 6.4 0.67 0.08 2.1
0.045
1251 7.5 0.58 0.14 2.2
0.077

free sulfur dioxide total sulfur dioxide density pH

sulphates \
925 53.0 77.0 0.99604 3.47
0.87
363 6.0 15.0 0.99880 2.99
0.87
906 12.0 78.0 0.99640 3.39
0.71
426 19.0 48.0 0.99490 3.49
0.49
1251 27.0 60.0 0.99630 3.28
0.59

alcohol
925 11.0
363 10.2
906 11.0
426 11.4
1251 9.8

X_test.head()

fixed acidity volatile acidity citric acid residual sugar

chlorides \
803 7.7 0.56 0.08 2.50
0.114
124 7.8 0.50 0.17 1.60
0.082
350 10.7 0.67 0.22 2.70
0.107
682 8.5 0.46 0.31 2.25
0.078
1326 6.7 0.46 0.24 1.70
0.077

free sulfur dioxide total sulfur dioxide density pH

sulphates \
803 14.0 46.0 0.9971 3.24
0.66
124 21.0 102.0 0.9960 3.39
0.48
350 17.0 34.0 1.0004 3.28
0.98
682 32.0 58.0 0.9980 3.33
0.54
1326 18.0 34.0 0.9948 3.39
0.60

alcohol
803 9.6
124 9.5
350 9.9
682 9.8
1326 10.6

Model Training
Feature Scaling
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

X_train_scaled

array([[ 1.69536131e-01, -1.72107140e+00, 4.59303345e-01, ...,

1.01180685e+00, 1.22661179e+00, 5.50057013e-01],
[ 2.44606730e+00, -4.01957443e-01, 1.84105501e+00, ...,
-2.10687612e+00, 1.22661179e+00, -2.05174641e-01],
[-6.47680186e-01, 3.77472102e-02, -1.28054303e-03, ...,
4.92026353e-01, 2.97270776e-01, 5.50057013e-01],
...,
[-6.47680186e-01, 4.77451864e-01, -1.07597628e+00, ...,
1.27169710e+00, -6.90154049e-01, -8.66002338e-01],
[-2.39072027e-01, -1.83099757e+00, 4.08127357e-01, ...,
3.72184202e-02, 8.20025095e-01, 1.39969262e+00],
[-1.46489650e+00, -1.33632983e+00, -5.24565306e-02, ...,
4.92026353e-01, -6.90154049e-01, 2.91015593e+00]])

X_test_scaled

array([[-0.35581722, 0.14767337, -0.97362431, ..., -0.48256207,

0.00685171, -0.77159838],
[-0.29744462, -0.18210512, -0.51304042, ..., 0.49202635,
-1.03865693, -0.86600234],
[ 1.39536061, 0.75226727, -0.25716048, ..., -0.22267183,
1.86553373, -0.48838651],
...,
[-0.93954316, -0.40195744, -0.15480851, ..., 0.49202635,
-0.34165117, 0.17244119],
[ 1.27861542, -0.12714203, 1.892231 , ..., -1.4571505 ,
0.00685171, 1.30528867],
[ 0.92837985, -0.18210512, -0.15480851, ..., 0.16716354,
-0.80632167, -0.39398255]])

Logistic Refression
lr = LogisticRegression()
lr

LogisticRegression()

#training the model

lr.fit(X_train, y_train)
lr.score(X_train, y_train)

0.8838248436103664

# testing the model

lr_pred = lr.predict(X_test)
accuracy_score(y_test, lr_pred)

0.85625

Support Vector Machine (SVM)

clf = svm.SVC(kernel='rbf')
clf

SVC()

# training the model

clf.fit(X_train, y_train)
clf.score(X_train, y_train)

0.8668453976764968

# testing the model

sv_pred = clf.predict(X_test)
accuracy_score(y_test, sv_pred)

0.8625
Decision Tree
dtree = DecisionTreeClassifier()
dtree

DecisionTreeClassifier()

# training the model

dtree.fit(X_train, y_train)
dtree.score(X_train, y_train)

1.0

# testing the model

tr_pred = dtree.predict(X_test)
accuracy_score(y_test, tr_pred)

0.8604166666666667

K-Nearest Neighbors (KNN)

from sklearn.neighbors import KNeighborsClassifier
knn = KNeighborsClassifier(n_neighbors=5)
knn

KNeighborsClassifier()

# training the model

knn.fit(X_train, y_train)
knn.score(X_train, y_train)

0.9079535299374442

# testing the model

kn_pred = knn.predict(X_test)
accuracy_score(y_test, kn_pred)

0.8583333333333333

Model Evaluation
Logistic Regression
# logistic regression model evaluation
sns.heatmap(confusion_matrix(y_test, lr_pred), annot=True,
cmap='Blues')
plt.ylabel('Predicted Values')
plt.xlabel('Actual Values')
plt.title('Confusion Matrix for Logistic Regression')
plt.show()

print('Logistic Regression Model Accuracy: ', accuracy_score(y_test,

lr_pred))
print('Logistic Regression Model f1 score: ', metrics.f1_score(y_test,
lr_pred))
print('Logistic Regression Model MAE: ',
metrics.mean_absolute_error(y_test, lr_pred))
print('Logistic Regression Model RMSE: ',
np.sqrt(metrics.mean_squared_error(y_test, lr_pred)))

Logistic Regression Model Accuracy: 0.85625

Logistic Regression Model f1 score: 0.28865979381443296
Logistic Regression Model MAE: 0.14375
Logistic Regression Model RMSE: 0.3791437722025775
Support Vector Machine (SVM)
sns.heatmap(confusion_matrix(y_test, sv_pred), annot=True,
cmap='Reds')
plt.ylabel('Predicted Values')
plt.xlabel('Actual Values')
plt.title('Confusion Matrix for Support Vector Machine')
plt.show()

print('Support Vector Machine Model Accuracy: ',

accuracy_score(y_test, sv_pred))
print('Support Vector Machine Model f1 score: ',
metrics.f1_score(y_test, sv_pred))
print('Support Vector Machine Model MAE: ',
metrics.mean_absolute_error(y_test, sv_pred))
print('Support Vector Machine Model RMSE: ',
np.sqrt(metrics.mean_squared_error(y_test, sv_pred)))

Support Vector Machine Model Accuracy: 0.8625

Support Vector Machine Model f1 score: 0.029411764705882353
Support Vector Machine Model MAE: 0.1375
Support Vector Machine Model RMSE: 0.37080992435478316
Decision Tree
sns.heatmap(confusion_matrix(y_test, tr_pred), annot=True,
cmap='Greens')
plt.ylabel('Predicted Values')
plt.xlabel('Actual Values')
plt.title('Confusion Matrix for Decision Tree')
plt.show()

print('Decision Tree Model Accuracy: ', accuracy_score(y_test,

tr_pred))
print('Decision Tree Model f1 score: ', metrics.f1_score(y_test,
tr_pred))
print('Decision Tree Model MAE: ', metrics.mean_absolute_error(y_test,
tr_pred))
print('Decision Tree Model RMSE: ',
np.sqrt(metrics.mean_squared_error(y_test, tr_pred)))

Decision Tree Model Accuracy: 0.8604166666666667

Decision Tree Model f1 score: 0.5677419354838709
Decision Tree Model MAE: 0.13958333333333334
Decision Tree Model RMSE: 0.3736085295243316
K-Nearest Neighbors (KNN)
sns.heatmap(confusion_matrix(y_test, kn_pred), annot=True,
cmap='Purples')
plt.ylabel('Predicted Values')
plt.xlabel('Actual Values')
plt.title('Confusion Matrix for K-Nearest Neighbors')
plt.show()

print('K-Nearest Neighbors Model Accuracy: ', accuracy_score(y_test,

kn_pred))
print('K-Nearest Neighbors Model f1 score: ', metrics.f1_score(y_test,
kn_pred))
print('K-Nearest Neighbors Model MAE: ',
metrics.mean_absolute_error(y_test, kn_pred))
print('K-Nearest Neighbors Model RMSE: ',
np.sqrt(metrics.mean_squared_error(y_test, kn_pred)))

K-Nearest Neighbors Model Accuracy: 0.8583333333333333

K-Nearest Neighbors Model f1 score: 0.276595744680851
K-Nearest Neighbors Model MAE: 0.14166666666666666
K-Nearest Neighbors Model RMSE: 0.3763863263545405
Model Comparison
models = ['Logistic Regression', 'Support Vector Machine', 'Decision
Tree', 'K-Nearest Neighbors']
accuracy = [accuracy_score(y_test, lr_pred), accuracy_score(y_test,
sv_pred), accuracy_score(y_test, tr_pred), accuracy_score(y_test,
kn_pred)]
plt.figure(figsize=(10,6))
sns.barplot(x=models, y=accuracy)
plt.title('Model Accuracy Comparison')
plt.xlabel('Model')
plt.ylabel('Accuracy')
plt.ylim(0.5, 1.0)
plt.show()

Conclusion
It is observed that the Logistic Regression model performs the best on the test set
with an accuracy of 86%. The model can predict the quality of the wine based on the
given features with an accuracy of 86%.

CFE Sismo
No ratings yet
CFE Sismo
29 pages
Principles of Engineering Thermodynamics - SI Version 8th Edition
No ratings yet
Principles of Engineering Thermodynamics - SI Version 8th Edition
47 pages
Assignment4 VidulGarg
No ratings yet
Assignment4 VidulGarg
14 pages
Wine Quality Prediction
No ratings yet
Wine Quality Prediction
6 pages
tp
No ratings yet
tp
13 pages
Karisma_23011101119_eda_rec
No ratings yet
Karisma_23011101119_eda_rec
88 pages
ML LAB 12 - Jupyter Notebook
No ratings yet
ML LAB 12 - Jupyter Notebook
11 pages
Data Mining 1 Practical File-1
No ratings yet
Data Mining 1 Practical File-1
24 pages
Code
No ratings yet
Code
5 pages
Quality Prediction Checkpoint
No ratings yet
Quality Prediction Checkpoint
14 pages
EDA RED WINE
No ratings yet
EDA RED WINE
16 pages
datamining_exp5_datanormalisation
No ratings yet
datamining_exp5_datanormalisation
14 pages
Wine DS
No ratings yet
Wine DS
14 pages
USL - 21070126112 - Colaboratory
No ratings yet
USL - 21070126112 - Colaboratory
3 pages
Name: Reg. No.: Lab Exercise:: Shivam Batra 19BPS1131
100% (1)
Name: Reg. No.: Lab Exercise:: Shivam Batra 19BPS1131
10 pages
Planilha Sem Título
No ratings yet
Planilha Sem Título
56 pages
Central Tendency and Dispersion Analysis_12212204
No ratings yet
Central Tendency and Dispersion Analysis_12212204
14 pages
Practical04.ipynb - Colab
No ratings yet
Practical04.ipynb - Colab
2 pages
Tabela Agua
No ratings yet
Tabela Agua
12 pages
Equilibrio de Fases (Benceno/Metanol) 1. Utilización de Software (Chemcad) Por Raoult
No ratings yet
Equilibrio de Fases (Benceno/Metanol) 1. Utilización de Software (Chemcad) Por Raoult
15 pages
Equilibrio de Fases (Benceno/Metanol) 1. Utilización de Software (Chemcad) Por Raoult
No ratings yet
Equilibrio de Fases (Benceno/Metanol) 1. Utilización de Software (Chemcad) Por Raoult
15 pages
Property Tables in English Units
No ratings yet
Property Tables in English Units
48 pages
Procemin 2015 Flotation Plant Design With Aminfloat Simulator
No ratings yet
Procemin 2015 Flotation Plant Design With Aminfloat Simulator
24 pages
14-May - Jupyter Notebook
No ratings yet
14-May - Jupyter Notebook
15 pages
TABLE OF CORRELATION ANALYSIS 1
No ratings yet
TABLE OF CORRELATION ANALYSIS 1
2 pages
Andres Felipe Silva y Santiago Arroyave Datos
No ratings yet
Andres Felipe Silva y Santiago Arroyave Datos
5 pages
Fractionators
No ratings yet
Fractionators
9 pages
Steam Tables
No ratings yet
Steam Tables
20 pages
2
No ratings yet
2
6 pages
PVT Data of Molten Copolymers 6.1. Experimental Data And/or Tait Equation Parameters
No ratings yet
PVT Data of Molten Copolymers 6.1. Experimental Data And/or Tait Equation Parameters
90 pages
Distillation Theoretical Stages Calculator
No ratings yet
Distillation Theoretical Stages Calculator
2,155 pages
890 Tables in SI Units: Table A-1
No ratings yet
890 Tables in SI Units: Table A-1
22 pages
MIE210 Property Tables
No ratings yet
MIE210 Property Tables
26 pages
) of Pure Sucrose Solutions) of Impure Sucrose Solutions: DS DS
0% (1)
) of Pure Sucrose Solutions) of Impure Sucrose Solutions: DS DS
23 pages
Rutile R040049-1 Powder DIF File 3181
No ratings yet
Rutile R040049-1 Powder DIF File 3181
1 page
Physical Properties of Sucrose Solution
0% (1)
Physical Properties of Sucrose Solution
23 pages
tr435yh
No ratings yet
tr435yh
11 pages
API MPMS 1
No ratings yet
API MPMS 1
77 pages
Certificate of Analysis: Brammer Standard Company, Inc
No ratings yet
Certificate of Analysis: Brammer Standard Company, Inc
2 pages
CHEE3741 2016 Assignments PDF
No ratings yet
CHEE3741 2016 Assignments PDF
16 pages
Database XRD
No ratings yet
Database XRD
6 pages
Property Tables
No ratings yet
Property Tables
33 pages
BASRID 922 March 2024 16
No ratings yet
BASRID 922 March 2024 16
1 page
BASRID 922 March 2024 16
No ratings yet
BASRID 922 March 2024 16
1 page
Record
No ratings yet
Record
27 pages
Oxychem NaOH Membrane Vs Diaphragm
No ratings yet
Oxychem NaOH Membrane Vs Diaphragm
1 page
Steam Table
No ratings yet
Steam Table
10 pages
Criterio de Ross: Datos E.C. NV MULA: FD (1 - (E/VUT) 1.4) F E.C. R E.C.RE E.C.Rep E.C.D
No ratings yet
Criterio de Ross: Datos E.C. NV MULA: FD (1 - (E/VUT) 1.4) F E.C. R E.C.RE E.C.Rep E.C.D
6 pages
Water Portability Sunig R
No ratings yet
Water Portability Sunig R
4 pages
Coding An
No ratings yet
Coding An
19 pages
learning-concepts-hackers-realm
No ratings yet
learning-concepts-hackers-realm
78 pages
Steam Tables
No ratings yet
Steam Tables
12 pages
Steam Tables
No ratings yet
Steam Tables
21 pages
Steam Tables PDF
No ratings yet
Steam Tables PDF
21 pages
2011f F II.4
No ratings yet
2011f F II.4
29 pages
Basic Python Analysis
No ratings yet
Basic Python Analysis
33 pages
Steam Table For Compressed Liquid & Superheated Steam PDF
No ratings yet
Steam Table For Compressed Liquid & Superheated Steam PDF
60 pages
NISTIR5078 Tab3
No ratings yet
NISTIR5078 Tab3
60 pages
%trabajamos Con Los Componentes Metanol y 1-Hepteno %componente Metanol
No ratings yet
%trabajamos Con Los Componentes Metanol y 1-Hepteno %componente Metanol
3 pages
A List of Factorial Math Constants
From Everand
A List of Factorial Math Constants
Archive Classics
No ratings yet
Rocker Bogie
No ratings yet
Rocker Bogie
31 pages
Mainprojectedtd 151114185045 Lva1 App6892
No ratings yet
Mainprojectedtd 151114185045 Lva1 App6892
14 pages
Smart Helmet For Driver
No ratings yet
Smart Helmet For Driver
15 pages
Floating Windmill Powerpoint
100% (1)
Floating Windmill Powerpoint
25 pages
Book List
No ratings yet
Book List
2 pages
Control Systems - From Mathematical Modelling To PID Control - Online Engineering Courses
No ratings yet
Control Systems - From Mathematical Modelling To PID Control - Online Engineering Courses
1 page
Aoa MCQS
No ratings yet
Aoa MCQS
14 pages
Anomaly Detection: A Tutorial: Arindam Banerjee, Varun Chandola, Vipin Kumar, Jaideep Srivastava
No ratings yet
Anomaly Detection: A Tutorial: Arindam Banerjee, Varun Chandola, Vipin Kumar, Jaideep Srivastava
101 pages
AP4
No ratings yet
AP4
1 page
10b Sorting
No ratings yet
10b Sorting
29 pages
Linear Vector Quntization
No ratings yet
Linear Vector Quntization
22 pages
Hurst Exponent and Financial Market Predictability
No ratings yet
Hurst Exponent and Financial Market Predictability
7 pages
Political Science 582: Quantitative Analysis in Political Science II, Fall 2011, Seigle Hall L016
No ratings yet
Political Science 582: Quantitative Analysis in Political Science II, Fall 2011, Seigle Hall L016
3 pages
Stock Market Volatility Forecasting: Do We Need High-Frequency Data?
No ratings yet
Stock Market Volatility Forecasting: Do We Need High-Frequency Data?
19 pages
Chapter 2 - Solution To Worked Examples
No ratings yet
Chapter 2 - Solution To Worked Examples
6 pages
MATH224 (302) EngMaths (Num - Meth) - Summer14 15FinalExamQ&A - 17 08 15
No ratings yet
MATH224 (302) EngMaths (Num - Meth) - Summer14 15FinalExamQ&A - 17 08 15
5 pages
Instance Normalization: The Missing Ingredient For Fast Stylization
No ratings yet
Instance Normalization: The Missing Ingredient For Fast Stylization
6 pages
Dimensionality Reduction
No ratings yet
Dimensionality Reduction
3 pages
Population Math Practice
No ratings yet
Population Math Practice
2 pages
SAMPLE 1 Pure Unit 1 SBA
No ratings yet
SAMPLE 1 Pure Unit 1 SBA
20 pages
Prisoner's Dilemma Slides
100% (1)
Prisoner's Dilemma Slides
44 pages
Unit 2 - PERT and CPM Numericals
100% (9)
Unit 2 - PERT and CPM Numericals
8 pages
Gate Da
No ratings yet
Gate Da
221 pages
Unknowns On Both Sides SOLUTIONS
No ratings yet
Unknowns On Both Sides SOLUTIONS
1 page
Data Structures
No ratings yet
Data Structures
11 pages
High Dimensional Forecasting Via Interpretable Vector Autoregression
No ratings yet
High Dimensional Forecasting Via Interpretable Vector Autoregression
52 pages
U2 L5 Modeling Equations With Variables On Both Sides
No ratings yet
U2 L5 Modeling Equations With Variables On Both Sides
4 pages
Manova Iris
No ratings yet
Manova Iris
12 pages
EXP-2 FULL Subtractor
No ratings yet
EXP-2 FULL Subtractor
5 pages
Emotion Classification On Youtube Comments
No ratings yet
Emotion Classification On Youtube Comments
5 pages
2024 Y9 Extension Examination - Marking Schedule
No ratings yet
2024 Y9 Extension Examination - Marking Schedule
10 pages
Full download Introduction to Process Control Chemical Industries 3rd Edition Jose A. Romagnoli pdf docx
100% (1)
Full download Introduction to Process Control Chemical Industries 3rd Edition Jose A. Romagnoli pdf docx
55 pages
Course File - Cse - Daa 2022-23 Venkat
No ratings yet
Course File - Cse - Daa 2022-23 Venkat
60 pages

Quality Prediction

Uploaded by

Quality Prediction

Uploaded by

# importing libraries

# Loding the dataset

fixed acidity volatile acidity citric acid residual sugar

free sulfur dioxide total sulfur dioxide density pH

[1599 rows x 12 columns]

# Checking for null values

fixed acidity volatile acidity citric acid residual sugar \

chlorides free sulfur dioxide total sulfur dioxide

pH sulphates alcohol quality

fixed acidity volatile acidity citric acid residual sugar

free sulfur dioxide total sulfur dioxide density pH sulphates

1 25.0 67.0 0.9968 3.20 0.68

2 15.0 54.0 0.9970 3.26 0.65

3 17.0 60.0 0.9980 3.16 0.58

4 11.0 34.0 0.9978 3.51 0.56

sns.catplot(x='quality', data=df, kind='count')

<AxesSubplot:xlabel='quality', ylabel='volatile acidity'>

<AxesSubplot:xlabel='quality', ylabel='citric acid'>

fixed acidity volatile acidity citric acid residual sugar

free sulfur dioxide total sulfur dioxide density pH sulphates

2 15.0 54.0 0.9970 3.26 0.65

3 17.0 60.0 0.9980 3.16 0.58

4 11.0 34.0 0.9978 3.51 0.56

alcohol good quality

Train Test Split

fixed acidity volatile acidity citric acid residual sugar

free sulfur dioxide total sulfur dioxide density pH

fixed acidity volatile acidity citric acid residual sugar

free sulfur dioxide total sulfur dioxide density pH

array([[ 1.69536131e-01, -1.72107140e+00, 4.59303345e-01, ...,

array([[-0.35581722, 0.14767337, -0.97362431, ..., -0.48256207,

#training the model

# testing the model

Support Vector Machine (SVM)

# training the model

# testing the model

# training the model

# testing the model

K-Nearest Neighbors (KNN)

# training the model

# testing the model

print('Logistic Regression Model Accuracy: ', accuracy_score(y_test,

Logistic Regression Model Accuracy: 0.85625

print('Support Vector Machine Model Accuracy: ',

Support Vector Machine Model Accuracy: 0.8625

print('Decision Tree Model Accuracy: ', accuracy_score(y_test,

Decision Tree Model Accuracy: 0.8604166666666667

print('K-Nearest Neighbors Model Accuracy: ', accuracy_score(y_test,

K-Nearest Neighbors Model Accuracy: 0.8583333333333333

You might also like