0% found this document useful (0 votes)

0 views

ml using python programs

The document provides Python code examples for implementing K-Nearest Neighbors (KNN), Decision Trees, and Random Forests for both classification and regression tasks using the scikit-learn library. It includes data loading, model training, evaluation metrics, and visualization techniques. Sample outputs demonstrate the performance of each model, including accuracy for classification and mean squared error for regression.

Uploaded by

lokeshsivarathri

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

0 views

ml using python programs

Uploaded by

lokeshsivarathri

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 12

KNN for Classification and Regression

# Import necessary libraries

import numpy as np
from sklearn.datasets import load_iris, make_regression
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier,
KNeighborsRegressor
from sklearn.metrics import accuracy_score, mean_squared_error

# ---------------- KNN for Classification ---------------- #

# Load the Iris dataset for classification

iris = load_iris()
X_classification = iris.data
y_classification = iris.target

# Split the dataset into training and testing sets

X_train_c, X_test_c, y_train_c, y_test_c = train_test_split(
X_classification, y_classification, test_size=0.3, random_state=42
)

# Initialize the KNN classifier with k=3

knn_classifier = KNeighborsClassifier(n_neighbors=3)
# Train the model
knn_classifier.fit(X_train_c, y_train_c)

# Predict on the test set

y_pred_c = knn_classifier.predict(X_test_c)

# Calculate accuracy
accuracy = accuracy_score(y_test_c, y_pred_c)
print("Classification Results:")
print(f"Accuracy: {accuracy * 100:.2f}%")

# ---------------- KNN for Regression ---------------- #

# Create a synthetic dataset for regression

X_regression, y_regression = make_regression(n_samples=200,
n_features=1, noise=10, random_state=42)

# Split the dataset into training and testing sets

X_train_r, X_test_r, y_train_r, y_test_r = train_test_split(
X_regression, y_regression, test_size=0.3, random_state=42
)

# Initialize the KNN regressor with k=3

knn_regressor = KNeighborsRegressor(n_neighbors=3)
# Train the model
knn_regressor.fit(X_train_r, y_train_r)

# Predict on the test set

y_pred_r = knn_regressor.predict(X_test_r)

# Calculate mean squared error

mse = mean_squared_error(y_test_r, y_pred_r)
print("\nRegression Results:")
print(f"Mean Squared Error: {mse:.2f}")

Output

When you run the above code, you'll get the following type of output:

Classification Results:

makefile
CopyEdit
Accuracy: 95.56%

Regression Results:

javascript
CopyEdit
Mean Squared Error: 82.35
Program: Decision Tree with Parameter Tuning
# Import necessary libraries
import numpy as np
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.tree import DecisionTreeClassifier, plot_tree
from sklearn.metrics import accuracy_score, classification_report
import matplotlib.pyplot as plt

# ---------------- Decision Tree for Classification ---------------- #

# Load the Iris dataset

iris = load_iris()
X = iris.data
y = iris.target

# Split the dataset into training and testing sets

X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size=0.3, random_state=42
)

# Initialize the Decision Tree Classifier

dt_classifier = DecisionTreeClassifier(random_state=42)

# Train the model

dt_classifier.fit(X_train, y_train)
# Predict on the test set
y_pred = dt_classifier.predict(X_test)

# Evaluate the model

accuracy = accuracy_score(y_test, y_pred)
print("Decision Tree Classification Results (Default Parameters):")
print(f"Accuracy: {accuracy * 100:.2f}%")
print("\nClassification Report:")
print(classification_report(y_test, y_pred))

# Plot the decision tree

plt.figure(figsize=(15, 10))
plot_tree(dt_classifier, filled=True, feature_names=iris.feature_names,
class_names=iris.target_names)
plt.title("Decision Tree Visualization")
plt.show()

# ---------------- Parameter Tuning using Grid Search ---------------- #

# Define parameter grid for tuning

param_grid = {
"criterion": ["gini", "entropy"],
"max_depth": [None, 3, 5, 10],
"min_samples_split": [2, 5, 10],
"min_samples_leaf": [1, 2, 4],
}

# Perform Grid Search with Cross-Validation

grid_search =
GridSearchCV(estimator=DecisionTreeClassifier(random_state=42),
param_grid=param_grid,
cv=5, scoring="accuracy", verbose=1, n_jobs=-1)

grid_search.fit(X_train, y_train)

# Get the best parameters and model

best_params = grid_search.best_params_
best_model = grid_search.best_estimator_

# Predict with the best model

y_pred_tuned = best_model.predict(X_test)

# Evaluate the tuned model

accuracy_tuned = accuracy_score(y_test, y_pred_tuned)
print("\nDecision Tree Classification Results (Tuned Parameters):")
print(f"Accuracy: {accuracy_tuned * 100:.2f}%")
print(f"Best Parameters: {best_params}")
print("\nClassification Report:")
print(classification_report(y_test, y_pred_tuned))

# Plot the tuned decision tree

plt.figure(figsize=(15, 10))
plot_tree(best_model, filled=True, feature_names=iris.feature_names,
class_names=iris.target_names)
plt.title("Tuned Decision Tree Visualization")
plt.show()
Sample Output

Default Decision Tree Results:

markdown
CopyEdit
Decision Tree Classification Results (Default Parameters):
Accuracy: 95.56%

Classification Report:
precision recall f1-score support

0 1.00 1.00 1.00 16

1 0.89 0.94 0.91 16
2 0.94 0.88 0.91 18

accuracy 0.96 50
macro avg 0.95 0.94 0.94 50
weighted avg 0.96 0.96 0.96 50

Tuned Decision Tree Results:

arduino
CopyEdit
Decision Tree Classification Results (Tuned Parameters):
Accuracy: 97.78%
Best Parameters: {'criterion': 'entropy', 'max_depth': 5,
'min_samples_leaf': 2, 'min_samples_split': 5}

Classification Report:
precision recall f1-score support

0 1.00 1.00 1.00 16

1 0.94 0.94 0.94 16
2 0.94 0.94 0.94 18

accuracy 0.98 50
macro avg 0.96 0.96 0.96 50
weighted avg 0.98 0.98 0.98 50
Program: Decision Tree for Regression
# Import necessary libraries
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_regression
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeRegressor, plot_tree
from sklearn.metrics import mean_squared_error, r2_score

# ---------------- Decision Tree for Regression ---------------- #

# Create a synthetic regression dataset

X, y = make_regression(n_samples=200, n_features=1, noise=15,
random_state=42)

# Split the dataset into training and testing sets

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3,
random_state=42)

# Initialize the Decision Tree Regressor

dt_regressor = DecisionTreeRegressor(random_state=42)

# Train the model

dt_regressor.fit(X_train, y_train)

# Predict on the test set

y_pred = dt_regressor.predict(X_test)
# Evaluate the model
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print("Decision Tree Regression Results:")

print(f"Mean Squared Error (MSE): {mse:.2f}")
print(f"R² Score: {r2:.2f}")

# ---------------- Visualization ---------------- #

# Plot the decision tree

plt.figure(figsize=(12, 8))
plot_tree(dt_regressor, filled=True, feature_names=["Feature"], rounded=True)
plt.title("Decision Tree Visualization")
plt.show()

# Plot predictions vs actual values

plt.figure(figsize=(8, 6))
plt.scatter(X_test, y_test, color="blue", label="Actual Values")
plt.scatter(X_test, y_pred, color="red", label="Predicted Values")
plt.title("Decision Tree Regression: Predictions vs Actual Values")
plt.xlabel("Feature")
plt.ylabel("Target")
plt.legend()
plt.show()

Sample Output

Regression Results:
mathematica
CopyEdit
Decision Tree Regression Results:
Mean Squared Error (MSE): 265.42
R² Score: 0.84

Random Forest for Classification and Regression:

# Import necessary libraries
import numpy as np
from sklearn.datasets import load_iris, make_regression
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier,
RandomForestRegressor
from sklearn.metrics import accuracy_score, classification_report,
mean_squared_error, r2_score
import matplotlib.pyplot as plt

# ---------------- Random Forest for Classification ---------------- #

# Load the Iris dataset

iris = load_iris()
X_classification = iris.data
y_classification = iris.target

# Split the dataset into training and testing sets

X_train_c, X_test_c, y_train_c, y_test_c = train_test_split(
X_classification, y_classification, test_size=0.3, random_state=42
)

# Initialize the Random Forest Classifier

rf_classifier = RandomForestClassifier(n_estimators=100, random_state=42)
# Train the model
rf_classifier.fit(X_train_c, y_train_c)

# Predict on the test set

y_pred_c = rf_classifier.predict(X_test_c)

# Evaluate the model

accuracy_c = accuracy_score(y_test_c, y_pred_c)
print("Random Forest Classification Results:")
print(f"Accuracy: {accuracy_c * 100:.2f}%")
print("\nClassification Report:")
print(classification_report(y_test_c, y_pred_c))

# ---------------- Random Forest for Regression ---------------- #

# Create a synthetic regression dataset

X_regression, y_regression = make_regression(n_samples=200, n_features=1,
noise=15, random_state=42)

# Split the dataset into training and testing sets

X_train_r, X_test_r, y_train_r, y_test_r = train_test_split(
X_regression, y_regression, test_size=0.3, random_state=42
)

# Initialize the Random Forest Regressor

rf_regressor = RandomForestRegressor(n_estimators=100, random_state=42)
# Train the model
rf_regressor.fit(X_train_r, y_train_r)

# Predict on the test set

y_pred_r = rf_regressor.predict(X_test_r)

# Evaluate the model

mse_r = mean_squared_error(y_test_r, y_pred_r)
r2_r = r2_score(y_test_r, y_pred_r)

print("\nRandom Forest Regression Results:")

print(f"Mean Squared Error (MSE): {mse_r:.2f}")
print(f"R² Score: {r2_r:.2f}")

# ---------------- Visualization for Regression ---------------- #

# Plot predictions vs actual values

plt.figure(figsize=(8, 6))
plt.scatter(X_test_r, y_test_r, color="blue", label="Actual Values")
plt.scatter(X_test_r, y_pred_r, color="red", label="Predicted Values")
plt.title("Random Forest Regression: Predictions vs Actual Values")
plt.xlabel("Feature")
plt.ylabel("Target")
plt.legend()
plt.show()

Becoming A Data Scientist StudyPlan
No ratings yet
Becoming A Data Scientist StudyPlan
10 pages
MCQ
100% (7)
MCQ
37 pages
ml lab programs 2
No ratings yet
ml lab programs 2
16 pages
ML 4,5,6 (Sample1)
No ratings yet
ML 4,5,6 (Sample1)
6 pages
FDS Lab Manual
No ratings yet
FDS Lab Manual
10 pages
ML Usar Manual-2
No ratings yet
ML Usar Manual-2
21 pages
Deep Learning Assignments
No ratings yet
Deep Learning Assignments
6 pages
Implementing KNN Algorithm: Importing Libraries
No ratings yet
Implementing KNN Algorithm: Importing Libraries
6 pages
ANN_EXPERIENTIAL_LEARNING
No ratings yet
ANN_EXPERIENTIAL_LEARNING
43 pages
Praveen Ai
No ratings yet
Praveen Ai
6 pages
LSTM - Jupyter Notebook
No ratings yet
LSTM - Jupyter Notebook
7 pages
6 - 2 - SVMS, - Randon - Forests - and - KNN - Ipynb - Colaboratory
No ratings yet
6 - 2 - SVMS, - Randon - Forests - and - KNN - Ipynb - Colaboratory
4 pages
Decision_Tree_Regression.ipynb - Colab
No ratings yet
Decision_Tree_Regression.ipynb - Colab
3 pages
Machine
100% (1)
Machine
45 pages
Data Mining Practicals
No ratings yet
Data Mining Practicals
22 pages
Ml-Exp-2 - Jupyter Notebook
No ratings yet
Ml-Exp-2 - Jupyter Notebook
2 pages
ML Report
No ratings yet
ML Report
14 pages
Decision Tree
No ratings yet
Decision Tree
6 pages
Experiment 6 Code
No ratings yet
Experiment 6 Code
3 pages
Binary Classification
No ratings yet
Binary Classification
2 pages
Vertopal.com_ML LAB 8
No ratings yet
Vertopal.com_ML LAB 8
9 pages
Case Study - Classifier
No ratings yet
Case Study - Classifier
5 pages
Deep Learning Techniques
No ratings yet
Deep Learning Techniques
9 pages
vertopal.com_project
No ratings yet
vertopal.com_project
16 pages
Machine Learnin
100% (2)
Machine Learnin
23 pages
456 ML Lab
No ratings yet
456 ML Lab
7 pages
23BCE7199 ML Lab Assignment[1]
No ratings yet
23BCE7199 ML Lab Assignment[1]
15 pages
3.1. Cross-Validation - Evaluating Estimator Performance - Scikit-Learn 1.3.0 Documentation
No ratings yet
3.1. Cross-Validation - Evaluating Estimator Performance - Scikit-Learn 1.3.0 Documentation
12 pages
ML MANUAL WITH OUTPUTS (2)
No ratings yet
ML MANUAL WITH OUTPUTS (2)
30 pages
Linearregression SVM
No ratings yet
Linearregression SVM
3 pages
20MIS1025 - DecisionTree - Ipynb - Colaboratory
No ratings yet
20MIS1025 - DecisionTree - Ipynb - Colaboratory
4 pages
Module_5
No ratings yet
Module_5
5 pages
Seguridad ML
No ratings yet
Seguridad ML
7 pages
AI Lab M.Tech
No ratings yet
AI Lab M.Tech
29 pages
ML INTERNAL ANSWERS
No ratings yet
ML INTERNAL ANSWERS
9 pages
hatespeech_code_ipynb
No ratings yet
hatespeech_code_ipynb
31 pages
Machine Learning LAB
No ratings yet
Machine Learning LAB
20 pages
MLA Lab 6:-Implementation of Decision Tree
No ratings yet
MLA Lab 6:-Implementation of Decision Tree
16 pages
AM19_ADL_semi-supervised-model
No ratings yet
AM19_ADL_semi-supervised-model
3 pages
Coe Projects
No ratings yet
Coe Projects
7 pages
vertopal.com_decision_tree
No ratings yet
vertopal.com_decision_tree
4 pages
ML Lab Manual
No ratings yet
ML Lab Manual
6 pages
Tasks
No ratings yet
Tasks
7 pages
Scikit-Learn - Permutation - Importance - Py at 38fba057 Scikit-Learn - Scikit-Learn GitHub
No ratings yet
Scikit-Learn - Permutation - Importance - Py at 38fba057 Scikit-Learn - Scikit-Learn GitHub
4 pages
5b Python Implementation of Decision Tree
No ratings yet
5b Python Implementation of Decision Tree
7 pages
Practical 6
No ratings yet
Practical 6
8 pages
CART Practical 6
No ratings yet
CART Practical 6
2 pages
Email Spam Classifier
No ratings yet
Email Spam Classifier
22 pages
AIML Practical 02 22105A2021
No ratings yet
AIML Practical 02 22105A2021
8 pages
ML Lab6
No ratings yet
ML Lab6
4 pages
Logistic Regression 2
No ratings yet
Logistic Regression 2
2 pages
phase 3
No ratings yet
phase 3
5 pages
Random_Forest_Classification.ipynb - Colab
No ratings yet
Random_Forest_Classification.ipynb - Colab
3 pages
Answer 1722791857 NLP and Classification Practical MCQ 4991
No ratings yet
Answer 1722791857 NLP and Classification Practical MCQ 4991
26 pages
Machine learning algorithms are generally categorized into three main types
No ratings yet
Machine learning algorithms are generally categorized into three main types
7 pages
Python Implementation of Random Forest Algorithm
No ratings yet
Python Implementation of Random Forest Algorithm
10 pages
Experiment 8 Code
No ratings yet
Experiment 8 Code
3 pages
Classification Is For Predicting Type and Regression Is For Predicting Value
No ratings yet
Classification Is For Predicting Type and Regression Is For Predicting Value
4 pages
Credit Card Fraud Detection
100% (1)
Credit Card Fraud Detection
14 pages
ML Assignment 4
No ratings yet
ML Assignment 4
7 pages
Tous Les Algo de ML
No ratings yet
Tous Les Algo de ML
7 pages
DATA MINING and MACHINE LEARNING: CLUSTER ANALYSIS and kNN CLASSIFIERS. Examples with MATLAB
From Everand
DATA MINING and MACHINE LEARNING: CLUSTER ANALYSIS and kNN CLASSIFIERS. Examples with MATLAB
César Pérez López
No ratings yet
The Use of Machine Learning Techniques To Advance The Detection and Classification of Unknown Malware
No ratings yet
The Use of Machine Learning Techniques To Advance The Detection and Classification of Unknown Malware
6 pages
Prediction of Heart Disease Using Machine Learning Techniques
No ratings yet
Prediction of Heart Disease Using Machine Learning Techniques
4 pages
Classification of ECG Signal Using FFT Based Impro
No ratings yet
Classification of ECG Signal Using FFT Based Impro
22 pages
Stock Market Prediction Using Machine Learning
100% (1)
Stock Market Prediction Using Machine Learning
49 pages
Motta, de Castro Neto, Sarmento - 2021 - A Mixed Approach For Urban Flood Prediction Using Machine Learning and GIS
No ratings yet
Motta, de Castro Neto, Sarmento - 2021 - A Mixed Approach For Urban Flood Prediction Using Machine Learning and GIS
13 pages
Machine Learning On Mainstream Microcontrollers
No ratings yet
Machine Learning On Mainstream Microcontrollers
26 pages
A Comparative Study of Classification Methods in Data Mining Using RapidMiner Studio
100% (1)
A Comparative Study of Classification Methods in Data Mining Using RapidMiner Studio
6 pages
A Survey On Application of Machine Learning For Internet of Things
No ratings yet
A Survey On Application of Machine Learning For Internet of Things
19 pages
Integrating Large Language Models For Severity Classification in Traffic Incident Management: A Machine Learning Approach
No ratings yet
Integrating Large Language Models For Severity Classification in Traffic Incident Management: A Machine Learning Approach
17 pages
Explainable Artificial Intelligence: A Comprehensive Review: Dang Minh H. Xiang Wang Y. Fen Li Tan N. Nguyen
No ratings yet
Explainable Artificial Intelligence: A Comprehensive Review: Dang Minh H. Xiang Wang Y. Fen Li Tan N. Nguyen
66 pages
Yasha Hasija, Rajkumar Chakraborty - Hands on Data Science for Biologists Using Python (2021, CRC Press) - Libgen.li
No ratings yet
Yasha Hasija, Rajkumar Chakraborty - Hands on Data Science for Biologists Using Python (2021, CRC Press) - Libgen.li
299 pages
FALLSEM2024-25 BCSE401L TH VL2024250102078 2024-09-04 Reference-Material-I
No ratings yet
FALLSEM2024-25 BCSE401L TH VL2024250102078 2024-09-04 Reference-Material-I
27 pages
Machine Learning With Scikit-Learn: George Boorman
No ratings yet
Machine Learning With Scikit-Learn: George Boorman
34 pages
Datamites Certified Data Scientist Syllabus PDF
50% (2)
Datamites Certified Data Scientist Syllabus PDF
12 pages
Network Anomaly Detection Using LSTMBased Autoencoder
No ratings yet
Network Anomaly Detection Using LSTMBased Autoencoder
10 pages
Analysis of Mood Based On Song Data Using Clustering and Supervised Learning Techniques
No ratings yet
Analysis of Mood Based On Song Data Using Clustering and Supervised Learning Techniques
3 pages
When Do We Use KNN Algorithm?
No ratings yet
When Do We Use KNN Algorithm?
7 pages
Milvus Overview
No ratings yet
Milvus Overview
53 pages
ML Notes Unit 1-2
No ratings yet
ML Notes Unit 1-2
55 pages
Laboratorium Voor Neuro
No ratings yet
Laboratorium Voor Neuro
28 pages
Mock Final Examination Model Answer: Faculty of Computer Studies TM351 Data Management and Analysis
No ratings yet
Mock Final Examination Model Answer: Faculty of Computer Studies TM351 Data Management and Analysis
9 pages
Probabilistic Reasoning: CS 188: Artificial Intelligence
No ratings yet
Probabilistic Reasoning: CS 188: Artificial Intelligence
10 pages
Self-Learning For Personalized Keyword Spotting On Ultra-Low-Power Audio Sensors
No ratings yet
Self-Learning For Personalized Keyword Spotting On Ultra-Low-Power Audio Sensors
11 pages
Autokorelasi Spasial
No ratings yet
Autokorelasi Spasial
35 pages
Machine Coding of Events Data
No ratings yet
Machine Coding of Events Data
43 pages
Tanaya and Akansha Major Project
No ratings yet
Tanaya and Akansha Major Project
74 pages
Instance-Based Learning: K-Nearest Neighbour Learning
No ratings yet
Instance-Based Learning: K-Nearest Neighbour Learning
21 pages
Supply Chain Management Using Machine Learning
No ratings yet
Supply Chain Management Using Machine Learning
43 pages