SOURCE CODE

Uploaded by

bharathbharath9361

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views

SOURCE CODE

Uploaded by

bharathbharath9361

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 4

import pandas as pd

import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

from statsmodels.tsa.arima.model import ARIMA

from sklearn.metrics import mean_squared_error
from math import sqrt
from sklearn.preprocessing import MinMaxScaler

from keras.models import Sequential

from keras.layers import Dense, LSTM
from tensorflow.keras.preprocessing.sequence import TimeseriesGenerator
df = pd.read_csv("/content/ep.csv")

df.head()
print("Missing values:\n")
df.isnull().sum()
df.fillna(method='ffill', inplace=True)
df.head()
df["site_eui"] = pd.to_numeric(df["site_eui"], errors="coerce")
# Plot original distribution
plt.figure(figsize=(8, 4))
df["site_eui"].hist(bins=50)
plt.title("Original Site EUI Distribution")
plt.xlabel("site_eui")
plt.ylabel("Frequency")
plt.grid(True)
plt.show()
Q1 = df["site_eui"].quantile(0.25)
Q3 = df["site_eui"].quantile(0.75)
IQR = Q3 - Q1

# Define bounds
lower_bound = Q1 - 1.5 * IQR
upper_bound = Q3 + 1.5 * IQR

# Count outliers
outliers = df[(df["site_eui"] < lower_bound) | (df["site_eui"] > upper_bound)]
print(f"Number of outliers in 'site_eui': {outliers.shape[0]}")
df_filtered = df[(df["site_eui"] >= lower_bound) & (df["site_eui"] <= upper_bound)]

# Plot cleaned distribution

plt.figure(figsize=(8, 4))
df_filtered["site_eui"].hist(bins=50)
plt.title("Site EUI After Outlier Removal")
plt.xlabel("site_eui")
plt.ylabel("Frequency")
plt.grid(True)
plt.show()
df['site_eui'] = pd.to_numeric(df['site_eui'], errors='coerce')
df['Year_Factor'] = pd.to_numeric(df['Year_Factor'], errors='coerce')

# Drop missing values in key fields

df = df.dropna(subset=['site_eui', 'Year_Factor'])

# Round year for grouping

df['year'] = df['Year_Factor'].round().astype('Int64')
print("Basic statistics for Site Energy Use Intensity:")
print(df['site_eui'].describe())
plt.figure(figsize=(10, 5))
plt.hist(df["site_eui"], bins=50, color="skyblue", edgecolor="black")
plt.title("Histogram of Site Energy Use Intensity (site_eui)")
plt.xlabel("Site EUI")
plt.ylabel("Frequency")
plt.grid(True)
plt.tight_layout()
plt.show()
climate_cols = [
"avg_temp", "cooling_degree_days", "heating_degree_days",
"precipitation_inches", "snowfall_inches", "snowdepth_inches",
"days_below_30F", "days_above_80F", "days_with_fog"
]

# Convert columns to numeric

for col in climate_cols:
if col in df.columns:
df[col] = pd.to_numeric(df[col], errors="coerce")

# Drop rows with all missing climate values

df_climate = df[climate_cols].dropna(how="all")

# Compute correlation matrix

correlation_matrix = df_climate.corr()

# Plot heatmap
plt.figure(figsize=(10, 8))
sns.heatmap(correlation_matrix, annot=True, cmap="coolwarm", linewidths=0.5)
plt.title("Correlation Heatmap: Climate-Related Features")
plt.tight_layout()
plt.show()
df["Year_Factor"] = pd.to_numeric(df["Year_Factor"], errors="coerce")
# Drop missing values
df = df.dropna(subset=["site_eui", "Year_Factor"])

# Group by year and calculate mean site_eui

yearly_avg = df.groupby("Year_Factor")["site_eui"].mean().reset_index()

# Plot
plt.figure(figsize=(10, 5))
plt.plot(yearly_avg["Year_Factor"], yearly_avg["site_eui"], marker="o", linestyle="-",
color="teal")
plt.title("Year-wise Average Site Energy Use Intensity (EUI)")
plt.xlabel("Year")
plt.ylabel("Average Site EUI")
plt.grid(True)
plt.tight_layout()
plt.show()
df_bar = df.groupby("Year_Factor")["site_eui"].mean().reset_index()
df_bar["Year_Factor"] = df_bar["Year_Factor"].astype(int)

# Generate colors using a colormap (e.g., viridis or tab20)

colors = plt.cm.tab20(np.linspace(0, 1, len(df_bar)))

# Plot with multiple colors

plt.figure(figsize=(10, 6))
plt.bar(df_bar["Year_Factor"], df_bar["site_eui"], color=colors)
plt.title("Average Site EUI by Year")
plt.xlabel("Year")
plt.ylabel("Average Site EUI")
plt.grid(True)
plt.tight_layout()
plt.show()
top_facilities = df["facility_type"].value_counts().nlargest(5)
plt.figure(figsize=(6, 6))
plt.pie(top_facilities.values, labels=top_facilities.index, autopct='%1.1f%%', startangle=140)
plt.title("Top 5 Facility Types Distribution")
plt.axis("equal")
plt.tight_layout()
plt.show()
unique_years = df["Year_Factor"].dropna().unique()[:5]
df_subset = df[df["Year_Factor"].isin(unique_years)]

# Create the boxplot

plt.figure(figsize=(10, 6))
sns.boxplot(x="Year_Factor", y="site_eui", data=df_subset)
plt.title("Site EUI Distribution for First 5 Unique Year_Factor Values")
plt.xlabel("Year")
plt.ylabel("Site EUI")
plt.grid(True)
plt.tight_layout()
plt.show()
plt.figure(figsize=(10, 6))
sns.scatterplot(x='floor_area', y='site_eui', data=df, hue='building_class', palette='Set1')
plt.title('Floor Area vs Site EUI')
plt.show()
plt.figure(figsize=(12, 6))
sns.violinplot(x='facility_type', y='site_eui', data=df, palette='muted')
plt.title('Site EUI Distribution by Facility Type')
plt.xticks(rotation=90)
plt.show()

035 Assignment PDF
No ratings yet
035 Assignment PDF
14 pages
Delhivery Mani
No ratings yet
Delhivery Mani
79 pages
Assignment 2
No ratings yet
Assignment 2
6 pages
Lesson 3.3: The Third Wave: The Information/Knowledge Age
No ratings yet
Lesson 3.3: The Third Wave: The Information/Knowledge Age
3 pages
Data_Analyzer
No ratings yet
Data_Analyzer
10 pages
Solar Power Generation Forecasting in Europe a Time Series Analysis
No ratings yet
Solar Power Generation Forecasting in Europe a Time Series Analysis
19 pages
DAVL PR1.2 Mit
No ratings yet
DAVL PR1.2 Mit
10 pages
Main.py Text File
No ratings yet
Main.py Text File
5 pages
210040145_CE764_Assignment1.
No ratings yet
210040145_CE764_Assignment1.
8 pages
MLRecord
No ratings yet
MLRecord
24 pages
codeppsjf
No ratings yet
codeppsjf
16 pages
External
No ratings yet
External
11 pages
EDA Plots Code
No ratings yet
EDA Plots Code
13 pages
Machine Learning Lab Manual (1)
No ratings yet
Machine Learning Lab Manual (1)
33 pages
ABCD
No ratings yet
ABCD
9 pages
Print Print Print Print: Import As
No ratings yet
Print Print Print Print: Import As
6 pages
Load Prediction With 20 Models
No ratings yet
Load Prediction With 20 Models
19 pages
Energy Price Prediction with XGBoost-Time Series
No ratings yet
Energy Price Prediction with XGBoost-Time Series
8 pages
PythonForMachineLearning
No ratings yet
PythonForMachineLearning
66 pages
ML Lab Programs
No ratings yet
ML Lab Programs
21 pages
Project Intern - Jupyter Notebook
No ratings yet
Project Intern - Jupyter Notebook
16 pages
Data Science Libraries
No ratings yet
Data Science Libraries
4 pages
ML Lab Manual
No ratings yet
ML Lab Manual
90 pages
mlalllabprgs
No ratings yet
mlalllabprgs
17 pages
ml_labmanual (3)
No ratings yet
ml_labmanual (3)
33 pages
Day Month Year Temperature RH Ws Rain FFMC DMC DC Isi Bui Fwi Classes 0 1 2 3 4
No ratings yet
Day Month Year Temperature RH Ws Rain FFMC DMC DC Isi Bui Fwi Classes 0 1 2 3 4
11 pages
Pramkk
No ratings yet
Pramkk
10 pages
exp_2_sdk_ok
No ratings yet
exp_2_sdk_ok
18 pages
Program
No ratings yet
Program
10 pages
Lab 3 ml
No ratings yet
Lab 3 ml
3 pages
ML Expt 1 Description
No ratings yet
ML Expt 1 Description
15 pages
ML Lab Prog1-5 (5) College PDF
No ratings yet
ML Lab Prog1-5 (5) College PDF
12 pages
UBER
No ratings yet
UBER
2 pages
indexdw (1)
No ratings yet
indexdw (1)
34 pages
Malicious Coding
No ratings yet
Malicious Coding
4 pages
DP
No ratings yet
DP
9 pages
ml manual
No ratings yet
ml manual
9 pages
Machine learning lab manual
No ratings yet
Machine learning lab manual
9 pages
batch1 ds
No ratings yet
batch1 ds
15 pages
Shiva Teja
No ratings yet
Shiva Teja
19 pages
EXP 07 (ML) - Ashu
No ratings yet
EXP 07 (ML) - Ashu
4 pages
221IT027_DA_lab3 (2)
No ratings yet
221IT027_DA_lab3 (2)
5 pages
Open CV
No ratings yet
Open CV
13 pages
Shaheed Zulfikar Ali Bhutto Institute of Science & Technology
No ratings yet
Shaheed Zulfikar Ali Bhutto Institute of Science & Technology
12 pages
Unit1 ML Programs
No ratings yet
Unit1 ML Programs
5 pages
IDM Assignment
No ratings yet
IDM Assignment
15 pages
Lab
No ratings yet
Lab
13 pages
Machine Learning Lab
No ratings yet
Machine Learning Lab
43 pages
prgm 4
No ratings yet
prgm 4
3 pages
unit 6 Pyspark_MLlib
No ratings yet
unit 6 Pyspark_MLlib
6 pages
EXP 07 (ML) - Darshu
No ratings yet
EXP 07 (ML) - Darshu
4 pages
EXP 07 (ML) - Sarthak
No ratings yet
EXP 07 (ML) - Sarthak
4 pages
19-20DecTestPICMIC
No ratings yet
19-20DecTestPICMIC
28 pages
Performing Analysis of Meteorological Data: Punam Seal
No ratings yet
Performing Analysis of Meteorological Data: Punam Seal
21 pages
Fds Slips
No ratings yet
Fds Slips
6 pages
Assignment3 200020094
No ratings yet
Assignment3 200020094
6 pages
EX 06 Giriraj - Py
No ratings yet
EX 06 Giriraj - Py
3 pages
Practical 5
No ratings yet
Practical 5
6 pages
Time Series Visualization From Raw Data To Insights
No ratings yet
Time Series Visualization From Raw Data To Insights
34 pages
DA lab
No ratings yet
DA lab
27 pages
C Language Programming Codes
From Everand
C Language Programming Codes
Durgesh
No ratings yet
ap-calculus-bc-2019-practice-exam-frq
No ratings yet
ap-calculus-bc-2019-practice-exam-frq
20 pages
GA-770T-D3L: User's Manual
No ratings yet
GA-770T-D3L: User's Manual
100 pages
Electronic Workshop 2 Course
No ratings yet
Electronic Workshop 2 Course
17 pages
Unit Ii
No ratings yet
Unit Ii
14 pages
Power Quality
0% (1)
Power Quality
35 pages
Baxter-King Notes 1998
No ratings yet
Baxter-King Notes 1998
13 pages
Chap5-Sampling Rate Conversion
No ratings yet
Chap5-Sampling Rate Conversion
22 pages
IP-Surveillance Design Guide PDF
No ratings yet
IP-Surveillance Design Guide PDF
55 pages
Template Cahier de Recette de Liaison MPR
No ratings yet
Template Cahier de Recette de Liaison MPR
39 pages
Flowchart Shapes
No ratings yet
Flowchart Shapes
4 pages
FIT5196-S2-2020 Assessment 1: Task 1: Parsing Text Files (U)
No ratings yet
FIT5196-S2-2020 Assessment 1: Task 1: Parsing Text Files (U)
4 pages
What Is The Significance of Solder Mask Defined Pads in Solder Pad PCBs
No ratings yet
What Is The Significance of Solder Mask Defined Pads in Solder Pad PCBs
10 pages
NSE4 - FGT-6.0.prepaway - Premium.exam.125q: Number: NSE4 - FGT-6.0 Passing Score: 800 Time Limit: 120 Min File Version: 2.2
No ratings yet
NSE4 - FGT-6.0.prepaway - Premium.exam.125q: Number: NSE4 - FGT-6.0 Passing Score: 800 Time Limit: 120 Min File Version: 2.2
52 pages
MMPC 008
No ratings yet
MMPC 008
5 pages
Week 5: Laplace Equations: Aravind EE1 6B131 Electrical Dept
No ratings yet
Week 5: Laplace Equations: Aravind EE1 6B131 Electrical Dept
4 pages
Omron E5EN Manual
No ratings yet
Omron E5EN Manual
141 pages
The Rise of The Knowledge Graph
No ratings yet
The Rise of The Knowledge Graph
88 pages
Price List: Airconditioning Systems
No ratings yet
Price List: Airconditioning Systems
72 pages
Guidelines For Laboratory Notebooks
No ratings yet
Guidelines For Laboratory Notebooks
2 pages
المشروع
No ratings yet
المشروع
6 pages
2024 Quiz 12
No ratings yet
2024 Quiz 12
3 pages
Chapter 5: Design of Goods and Services Goods and Services Selection
No ratings yet
Chapter 5: Design of Goods and Services Goods and Services Selection
18 pages
Smash 3000
No ratings yet
Smash 3000
4 pages
STE UNIT-5 Notes
No ratings yet
STE UNIT-5 Notes
14 pages
Online Food Ordering System in ASP Net S
No ratings yet
Online Food Ordering System in ASP Net S
5 pages
Allen Bradley 1756-CNB Control Net Bridge Module - Burn Only (103 Pages)
No ratings yet
Allen Bradley 1756-CNB Control Net Bridge Module - Burn Only (103 Pages)
203 pages
Barangay Development Plan Novalla S UPDATED
No ratings yet
Barangay Development Plan Novalla S UPDATED
87 pages
WellSky PharmaTrac Brochure 2019 PRESS
No ratings yet
WellSky PharmaTrac Brochure 2019 PRESS
8 pages
Hackermonthly Issue035
No ratings yet
Hackermonthly Issue035
40 pages