0% found this document useful (0 votes)

3 views

Practical_1

This document provides a comprehensive guide on setting up a data analysis environment using NumPy and Pandas. It covers creating and manipulating arrays, DataFrames, and performing statistical operations, along with data cleaning and visualization techniques. Additionally, it includes practical examples for real-world data analysis and integration of NumPy with Pandas.

Uploaded by

2203031050417

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

3 views

Practical_1

Uploaded by

2203031050417

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 5

1.

Setting Up the Environment

First, ensure you have the necessary libraries installed:

pip install numpy pandas scipy

2. Importing Libraries

Start by importing the required libraries:

import numpy as np
import pandas as pd
from statistics import mean, median, stdev

3. NumPy Operations

3.1 Creating and Manipulating Arrays

# Create a 1D array
array_1d = np.array([10, 20, 30, 40, 50])

# Create a 2D array
array_2d = np.array([[1, 2], [3, 4], [5, 6]])

# Perform mathematical operations

array_sum = array_1d + 5 # Add 5 to each element
array_mean = np.mean(array_1d) # Compute the mean
array_std = np.std(array_1d) # Compute the standard deviation

3.2 Useful NumPy Functions

# Generate a range of numbers

range_array = np.arange(1, 10, 2)

# Generate random numbers

random_array = np.random.rand(3, 3)
# Reshape arrays
reshaped = random_array.reshape(1, 9)

4. Pandas Operations

4.1 Creating DataFrames and Series

# Create a Series
series = pd.Series([10, 20, 30, 40, 50], name="Scores")

# Create a DataFrame
data = {
"Name": ["Alice", "Bob", "Charlie", "David", "Eva"],
"Age": [25, 30, 35, 40, 45],
"Score": [85, 90, 78, 88, 76],
}
df = pd.DataFrame(data)

4.2 Inspecting Data

# View first few rows

print(df.head())

# Summary of the data

print(df.describe())

4.3 Filtering and Sorting

# Filter rows where Score > 80

filtered_df = df[df["Score"] > 80]

# Sort by Age
sorted_df = df.sort_values(by="Age", ascending=False)

4.4 Data Manipulation

# Add a new column
df["Bonus"] = df["Score"] * 0.1

# Modify existing data

df.loc[df["Name"] == "Alice", "Score"] = 95

# Drop a column
df.drop(columns=["Bonus"], inplace=True)

4.5 Handling Missing Values

# Simulate missing data

df.loc[2, "Score"] = None

# Fill missing values

df["Score"].fillna(df["Score"].mean(), inplace=True)

# Drop rows with missing data

df.dropna(inplace=True)

5. Statistics Library Operations

The statistics library is useful for basic statistical operations:

# Calculate mean, median, and standard deviation

scores = df["Score"].tolist()
print("Mean:", mean(scores))
print("Median:", median(scores))
print("Standard Deviation:", stdev(scores))

6. Integrating NumPy with Pandas

You can use NumPy functions within Pandas:

# Calculate z-score
df["Z-Score"] = (df["Score"] - np.mean(df["Score"])) /
np.std(df["Score"])

7. Real-World Data Analysis Example

7.1 Loading Data

# Read a CSV file

data = pd.read_csv("data.csv")

# Display basic information

print(data.info())

7.2 Cleaning Data

# Drop duplicates
data.drop_duplicates(inplace=True)

# Handle missing values

data.fillna(data.mean(), inplace=True)

7.3 Aggregation

# Group by a column and calculate mean

grouped = data.groupby("Category")["Value"].mean()
print(grouped)

7.4 Exporting Data

# Save the cleaned data

data.to_csv("cleaned_data.csv", index=False)
8. Visualization

Pandas integrates with Matplotlib for basic visualization:

import matplotlib.pyplot as plt

# Plot a histogram
df["Score"].hist()
plt.title("Score Distribution")
plt.xlabel("Score")
plt.ylabel("Frequency")
plt.show()

# Plot a bar chart

df.plot(x="Name", y="Score", kind="bar", title="Scores by Name")
plt.show()

Manual Vamp 57
No ratings yet
Manual Vamp 57
286 pages
Python Cheat Sheet: Pandas - Numpy - Sklearn Matplotlib - Seaborn BS4 - Selenium - Scrapy
100% (3)
Python Cheat Sheet: Pandas - Numpy - Sklearn Matplotlib - Seaborn BS4 - Selenium - Scrapy
9 pages
A New Refutation of Time: Preliminary Note
100% (1)
A New Refutation of Time: Preliminary Note
16 pages
unit-3(FODS)
No ratings yet
unit-3(FODS)
34 pages
Usage of NumPy for Numerical Data in Detail
No ratings yet
Usage of NumPy for Numerical Data in Detail
52 pages
Ai Programs
No ratings yet
Ai Programs
22 pages
FDS RECORD-1-4
No ratings yet
FDS RECORD-1-4
18 pages
dav 2 unit
No ratings yet
dav 2 unit
55 pages
NumPy and Pandas Tutorial
No ratings yet
NumPy and Pandas Tutorial
8 pages
Report
No ratings yet
Report
18 pages
Pandas,Numpy,Matplotlib
No ratings yet
Pandas,Numpy,Matplotlib
11 pages
EXP1-siddhant gupta (23_SE_148)
No ratings yet
EXP1-siddhant gupta (23_SE_148)
17 pages
Python
No ratings yet
Python
32 pages
Course_ Introduction to Data Science (SD211105)
No ratings yet
Course_ Introduction to Data Science (SD211105)
10 pages
Data Exploration Preparation
No ratings yet
Data Exploration Preparation
12 pages
Pandas Numpy
No ratings yet
Pandas Numpy
4 pages
Data Analysis Lab - Final - 23-24
No ratings yet
Data Analysis Lab - Final - 23-24
11 pages
Learning_NumPy_and_pandas
No ratings yet
Learning_NumPy_and_pandas
3 pages
Python For Statistics
No ratings yet
Python For Statistics
40 pages
FDS Final Manual
No ratings yet
FDS Final Manual
41 pages
Python Notes by Prof T
No ratings yet
Python Notes by Prof T
10 pages
EDA_CODE_SNIPPETS
No ratings yet
EDA_CODE_SNIPPETS
17 pages
Ilovepdf Merged (2) Merged
No ratings yet
Ilovepdf Merged (2) Merged
65 pages
Assignment 01
No ratings yet
Assignment 01
3 pages
Pds Record Document Ds II
No ratings yet
Pds Record Document Ds II
36 pages
Ip Practical File
No ratings yet
Ip Practical File
23 pages
Pandas NumPy Practice Questions
No ratings yet
Pandas NumPy Practice Questions
2 pages
MACHINE LEARNING LAB WORD 12-1-2025. DOCUMENT
No ratings yet
MACHINE LEARNING LAB WORD 12-1-2025. DOCUMENT
68 pages
BasicAnalysis Using PYTHON
No ratings yet
BasicAnalysis Using PYTHON
6 pages
DSA lab manual pgms_fINAL
No ratings yet
DSA lab manual pgms_fINAL
34 pages
IDS-1
No ratings yet
IDS-1
30 pages
Practical File 2024
No ratings yet
Practical File 2024
25 pages
data science
No ratings yet
data science
42 pages
L6 and 7-Data Preprocessing-coding
No ratings yet
L6 and 7-Data Preprocessing-coding
34 pages
Class 1 - 2024 Business Analytics
No ratings yet
Class 1 - 2024 Business Analytics
8 pages
22mbada303 Module 4
No ratings yet
22mbada303 Module 4
32 pages
Fundamentals of Data Science Students
No ratings yet
Fundamentals of Data Science Students
52 pages
Financial Analytics With Python
100% (1)
Financial Analytics With Python
40 pages
Ad3411 - Student
No ratings yet
Ad3411 - Student
27 pages
IDML Lab Programs
No ratings yet
IDML Lab Programs
5 pages
ML Lab File Vijay Kumar
No ratings yet
ML Lab File Vijay Kumar
16 pages
Learninng Plan
No ratings yet
Learninng Plan
6 pages
More On Pandas
No ratings yet
More On Pandas
51 pages
Data Analysis Tools
No ratings yet
Data Analysis Tools
26 pages
Unit-2 Bda
No ratings yet
Unit-2 Bda
11 pages
Python Data Science 101
100% (1)
Python Data Science 101
41 pages
Unit 5 PythonPackages(Matplotlib)
No ratings yet
Unit 5 PythonPackages(Matplotlib)
24 pages
De&v Lab Manual
No ratings yet
De&v Lab Manual
91 pages
Lesson 07 Data Manipulation With Pandas
No ratings yet
Lesson 07 Data Manipulation With Pandas
82 pages
L_AND_T_project_Naveen 24cs002895
No ratings yet
L_AND_T_project_Naveen 24cs002895
7 pages
Python For Data Analysis
No ratings yet
Python For Data Analysis
47 pages
Exp_1_Introduction to Data Analytics and Python fundamentals_sdk_ok
No ratings yet
Exp_1_Introduction to Data Analytics and Python fundamentals_sdk_ok
9 pages
What is pandas
No ratings yet
What is pandas
9 pages
Data Visualization EDA-print
No ratings yet
Data Visualization EDA-print
18 pages
jenisha INTERNSHIP REPORT-2.docx (1)
No ratings yet
jenisha INTERNSHIP REPORT-2.docx (1)
19 pages
External
No ratings yet
External
11 pages
Python For Exploratory Data Analysis
No ratings yet
Python For Exploratory Data Analysis
12 pages
3rd Semester DDM AI DAA DEV Print Pages For Spiral Record 25-1-24 - Removed
No ratings yet
3rd Semester DDM AI DAA DEV Print Pages For Spiral Record 25-1-24 - Removed
28 pages
Informatics Practices Practical File
No ratings yet
Informatics Practices Practical File
8 pages
Utf-8''libraries Data Management
No ratings yet
Utf-8''libraries Data Management
9 pages
Data Science
No ratings yet
Data Science
18 pages
The Essential R Reference
From Everand
The Essential R Reference
Mark Gardener
No ratings yet
Fluidised 20bed 20combustion 20boilers
100% (1)
Fluidised 20bed 20combustion 20boilers
146 pages
Articles & Quantifiers
100% (1)
Articles & Quantifiers
10 pages
YCT IIT JEE Co - Ordinate Geometry
No ratings yet
YCT IIT JEE Co - Ordinate Geometry
88 pages
Nsconmsg Cheat Sheet PDF
No ratings yet
Nsconmsg Cheat Sheet PDF
1 page
Mark MSB English EN - LR - 6999200051
No ratings yet
Mark MSB English EN - LR - 6999200051
8 pages
Two Layer Soil Model
No ratings yet
Two Layer Soil Model
11 pages
Gambit Cylinder
No ratings yet
Gambit Cylinder
3 pages
Chem Listy Glass
No ratings yet
Chem Listy Glass
5 pages
Dual Core Vs Core 2 Duo
No ratings yet
Dual Core Vs Core 2 Duo
5 pages
CI BR: CBT - Condition-Based Tax Calculation Brazil (Updated)
No ratings yet
CI BR: CBT - Condition-Based Tax Calculation Brazil (Updated)
6 pages
? ???????? ?????
No ratings yet
? ???????? ?????
14 pages
Running Your Own Proficiency Test: R.R. Cook
No ratings yet
Running Your Own Proficiency Test: R.R. Cook
7 pages
BW145-D3 Service Training (2002)
100% (1)
BW145-D3 Service Training (2002)
117 pages
DiagBox v7 83
No ratings yet
DiagBox v7 83
2 pages
Lab - Manual - CG Final
No ratings yet
Lab - Manual - CG Final
60 pages
Manual de Mantenimiento 1.0
No ratings yet
Manual de Mantenimiento 1.0
40 pages
Answers To Question EE101-Experiment 1
0% (1)
Answers To Question EE101-Experiment 1
4 pages
Protocolo Field Test Claro
No ratings yet
Protocolo Field Test Claro
106 pages
javascript_programs for hsc board examination
No ratings yet
javascript_programs for hsc board examination
15 pages
Tips Omega Keys
No ratings yet
Tips Omega Keys
6 pages
GC AFTGuide
No ratings yet
GC AFTGuide
32 pages
Terrain Settlement Analysis
No ratings yet
Terrain Settlement Analysis
15 pages
STD 10 Maths QP New
No ratings yet
STD 10 Maths QP New
4 pages
Topic 6.1 Formative
No ratings yet
Topic 6.1 Formative
2 pages
Thanveer Ahamed K Guided By: Ms - Nincy Jose REG. NO: 13003793 S7 Ce-B Roll No: 61
No ratings yet
Thanveer Ahamed K Guided By: Ms - Nincy Jose REG. NO: 13003793 S7 Ce-B Roll No: 61
42 pages
Instant Download (eBook PDF) Linear System Theory and Design 4th Edition PDF All Chapters
100% (5)
Instant Download (eBook PDF) Linear System Theory and Design 4th Edition PDF All Chapters
41 pages
MQ SP T 7806 PDF
No ratings yet
MQ SP T 7806 PDF
52 pages
On-Board Shielding: Principles and Practice: Tim Williams 29th September 2010
No ratings yet
On-Board Shielding: Principles and Practice: Tim Williams 29th September 2010
9 pages

Practical_1

Uploaded by

Practical_1

Uploaded by

1.

Setting Up the Environment

First, ensure you have the necessary libraries installed:

pip install numpy pandas scipy

Start by importing the required libraries:

3.1 Creating and Manipulating Arrays

# Perform mathematical operations

3.2 Useful NumPy Functions

# Generate a range of numbers

# Generate random numbers

4.1 Creating DataFrames and Series

4.2 Inspecting Data

# View first few rows

# Summary of the data

4.3 Filtering and Sorting

# Filter rows where Score > 80

4.4 Data Manipulation

# Modify existing data

4.5 Handling Missing Values

# Simulate missing data

# Fill missing values

# Drop rows with missing data

5. Statistics Library Operations

The statistics library is useful for basic statistical operations:

# Calculate mean, median, and standard deviation

6. Integrating NumPy with Pandas

You can use NumPy functions within Pandas:

7. Real-World Data Analysis Example

7.1 Loading Data

# Read a CSV file

# Display basic information

7.2 Cleaning Data

# Handle missing values

# Group by a column and calculate mean

7.4 Exporting Data

# Save the cleaned data

Pandas integrates with Matplotlib for basic visualization:

import matplotlib.pyplot as plt

# Plot a bar chart

You might also like