2024 25 ODD CE449 BDA Syllabus

Uploaded by

vekejo8617

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

44 views

2024 25 ODD CE449 BDA Syllabus

Uploaded by

vekejo8617

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

CE449: BIG DATA ANALYTICS

Credits and Hours:

Teaching Scheme Theory Practical Tutorial Total Credit

Hours/week 3 2 0 5
4
Marks 100 50 0 150

Pre-requisite courses:
● Linux Operating System
● Database Management System
Objectives of the Course:
● Correlations of large amounts of data to uncover hidden patterns, and other insights
● To learn new services and products that will utilize for Big Data.

● Apply different technique for various sector of Big Data Analytics

Outline of the Course:

Sr. Title of the unit Minimum number
No. of hours
1. Big Data and Analytics 02
2. Introduction to Hadoop and Hadoop Architecture 07
3. HDFS, HIVE AND HBASE 08
4. Apache Spark 10
5. Spark SQL and Spark Streaming 10
6. Graph Analytics and Data Visualization 08
Total hours (Theory) : 45
Total hours (Lab) : 30
Total hours : 75
Detailed Syllabus:
1. Big Data and Analytics 02 Hours 10%
Introduction to Big Data, Big Data Characteristics, Types of Big
Data, Traditional Versus Big Data Approach, Technologies
Available for Big Data, Infrastructure for Big Data, Use of Data
Analytics, Big Data Challenges.
2. Introduction to Hadoop and Hadoop Architecture 07 Hours 15%
Big Data – Apache Hadoop & Hadoop EcoSystem, Moving
Data in and out of Hadoop – Understanding inputs and outputs
in Hadoop, Data Serialization
3. HDFS, HIVE AND HBASE 08 Hours 20%
HDFS-Overview, Installation and Shell, Hive Architecture and
Installation, Comparison with Traditional Database, HiveQL
Querying Data, Sorting And Aggregating, Map Reduce Scripts,
Joins & Sub queries, HBase concepts, Advanced Usage, Schema
Design, Advance Indexing
4. Apache Spark 10 Hours 20%
Introduction to Data Analysis with Spark, Downloading Spark and
Getting Started, Apache Spark components and API stack,
Application and Spark Session, Introduction to RDD, RDD and
Data Frames.
5. Spark SQL and Spark Streaming 10 Hours 20%
Big Data and Spark SQL, Spark-Managed Tables, Reading Tables
into Data Frames, Aggregations, Joins, Creating Views, Spark
Streaming and Challenges of Stream Processing, Spark’s
Streaming APIs, Spark streaming case study.
6. Graph Analytics and Data Visualization 08 Hours 15%
Apache Spark GraphX: Property Graph, Graph Operator,
SubGraph, Triplet, Neo4j: Modeling data with Neo4j, Cypher
Query Language: General clauses, Read and Write clauses.
Big Data Visualization with Power BI, Apache Super-Set
Course Outcome (COs):
At the end of the course, the students will be able to
CO1 Understand the key issues in big data management and its associated applications in intelligent
business and scientific computing
CO2 Acquire fundamental enabling techniques and scalable algorithms like Hadoop, Map Reduce, Hive
and Spark in big data analytics.
CO3 Evaluate and apply appropriate principles, techniques and theories to large-scale data science
problems using various databases with analytics and visualizations.

Sr. No Course Outcomes (Cos) Employability/

Entrepreneurship/
Skill development
1.
Understand the key issues in big data management
and its associated applications in intelligent Skill development
business and scientific computing

2. Acquire fundamental enabling techniques and scalable

algorithms like Hadoop, Map Reduce and NO SQL in big Employability
data analytics.
3. Interpret business models and scientific computing Entrepreneurship
paradigms and apply software tools for big data analytics. Employability

Course Articulation Matrix:

PO1 PO2 PO3 PO4 PO5 PO6 PO7 PO8 PO9 PO10 PO11 PO12 PSO1 PSO2

CO1 2 2 1 - - - - - - - - - 1 1
CO2 1 2 3 1 3 - - - - - - - 2 -
CO3 - 1 3 3 3 - - - - - - - 2 -

Enter correlation levels 1, 2 or 3 as defined below:

1: Slight (Low) 2: Moderate (Medium) 3: Substantial (High)
If there is no correlation, put “-”

Recommended Study Material:

❖ Text book:
1. Bart Baesens , Analytics in a Big Data World: The Essential Guide to Data
Science and its Applications, ,Wiley, 2014
2. Jules S. Damji, Learning SparkLightning-Fast Data Analytics, O’Reilly
Media Inc, 2020.
3. Spark: The Definitive Guide by Bill Chambers and Matei Zaharia, O’Reilly
Media Inc. 2018.

❖ Reference book:
1. Xyz Dirk Deroos et al., Hadoop for Dummies, Dreamtech Press, 2014.
2. Chuck Lam, Hadoop in Action, December, 2010.
3. Leskovec, Rajaraman, Ullman, Mining of Massive Datasets, Cambridge
University Press.
4. I.H. Witten and E. Frank, Data Mining: Practical Machine learning tools
and techniques.
❖ Web material:
1. https://cognitiveclass.ai/
2. https://codelabs.developers.google.com/
❖ Software & Platform:
1. Python, Scala, R
2. Hadoop, HBase, Hive, Spark
3. Casandra, Neo4j, NoSQL

Cloud Digital Leader by Google Actual Free Exam Q&As
100% (1)
Cloud Digital Leader by Google Actual Free Exam Q&As
53 pages
113 Ce 74
No ratings yet
113 Ce 74
4 pages
BDA Syllabus
No ratings yet
BDA Syllabus
4 pages
Course Pack BDA
No ratings yet
Course Pack BDA
6 pages
Big Data analyticsNEW SYLLABUS FRAMING
No ratings yet
Big Data analyticsNEW SYLLABUS FRAMING
3 pages
BCA-BIGDATA-FIFTH_SEM-APPROVED-SYLLABUS
No ratings yet
BCA-BIGDATA-FIFTH_SEM-APPROVED-SYLLABUS
23 pages
Big Data Analytics
No ratings yet
Big Data Analytics
2 pages
19CS4701D
No ratings yet
19CS4701D
2 pages
SEM VII BDA Syllabus Theory
No ratings yet
SEM VII BDA Syllabus Theory
4 pages
B.Tech. CS_CE and CSE Syllabus 3rd Year 2024-25
No ratings yet
B.Tech. CS_CE and CSE Syllabus 3rd Year 2024-25
2 pages
BDA Syllabus - Sem VII - Mumbai University
No ratings yet
BDA Syllabus - Sem VII - Mumbai University
3 pages
No SQL Database in Bda
No ratings yet
No SQL Database in Bda
84 pages
1. Introduction of Subject
No ratings yet
1. Introduction of Subject
28 pages
BE-AIDS-R-20-VII-VIII-Sem-Syllabus_compressed
No ratings yet
BE-AIDS-R-20-VII-VIII-Sem-Syllabus_compressed
55 pages
Big Data Analytics- sem 7 CVMU
No ratings yet
Big Data Analytics- sem 7 CVMU
4 pages
Big Data Analytics Comp Syllabus Sem7
No ratings yet
Big Data Analytics Comp Syllabus Sem7
4 pages
Big Data Analytics
No ratings yet
Big Data Analytics
3 pages
Big Data-2
No ratings yet
Big Data-2
3 pages
Information Technology Engineering Syllabus Sem Viii Mumbai University
No ratings yet
Information Technology Engineering Syllabus Sem Viii Mumbai University
60 pages
Big Data Analytics-Digital Notes
No ratings yet
Big Data Analytics-Digital Notes
86 pages
IOT Analytics - AI361
No ratings yet
IOT Analytics - AI361
3 pages
Bite411l Big-data-Analytics TH 1.0 73 Bite411l 67 Acp
No ratings yet
Bite411l Big-data-Analytics TH 1.0 73 Bite411l 67 Acp
2 pages
Syllabus of Big Data Analysis - Proposed
No ratings yet
Syllabus of Big Data Analysis - Proposed
2 pages
Big Data With Hadoop and Spark_2023-25
No ratings yet
Big Data With Hadoop and Spark_2023-25
4 pages
Bigdata Syllabus
No ratings yet
Bigdata Syllabus
3 pages
22IS61 Big data analytics 2025
No ratings yet
22IS61 Big data analytics 2025
4 pages
Bigdata
No ratings yet
Bigdata
3 pages
Big Data and Analytics Syllabus 2021
No ratings yet
Big Data and Analytics Syllabus 2021
3 pages
Syllabus
No ratings yet
Syllabus
3 pages
BIG DATA ANALYTICS - Syllabus
No ratings yet
BIG DATA ANALYTICS - Syllabus
4 pages
Big Data Analytics (R20a0520)
No ratings yet
Big Data Analytics (R20a0520)
84 pages
Big Data - 2 Marks-1
No ratings yet
Big Data - 2 Marks-1
1 page
COMP9313: Big Data Management
No ratings yet
COMP9313: Big Data Management
79 pages
Int 421
No ratings yet
Int 421
2 pages
Big Data Analytics Syllabus_22UAI603C_204_2025
No ratings yet
Big Data Analytics Syllabus_22UAI603C_204_2025
2 pages
Data Analytics TOC
No ratings yet
Data Analytics TOC
6 pages
Big Data Analytics Course Outline (Fall 2020) : Dr. Tariq Mahmood 830 Am - 11 Am (Monday) Scope
No ratings yet
Big Data Analytics Course Outline (Fall 2020) : Dr. Tariq Mahmood 830 Am - 11 Am (Monday) Scope
3 pages
Big Data Syllabus
No ratings yet
Big Data Syllabus
2 pages
IT_(R20)_4-1_BIG DATA ANALYTICS_DIGITAL NOTES (1)
No ratings yet
IT_(R20)_4-1_BIG DATA ANALYTICS_DIGITAL NOTES (1)
117 pages
Big Data Training in Chennai - Big Data Course in Chennai
No ratings yet
Big Data Training in Chennai - Big Data Course in Chennai
1 page
Big Data Syllabus For Theory and Lab
No ratings yet
Big Data Syllabus For Theory and Lab
4 pages
CCS334 BDA Syllabus
No ratings yet
CCS334 BDA Syllabus
5 pages
Big Data Analytics Digital Notes
No ratings yet
Big Data Analytics Digital Notes
119 pages
ET472datamanagementandanalytics
No ratings yet
ET472datamanagementandanalytics
4 pages
Big Data Analytics Syllabus
No ratings yet
Big Data Analytics Syllabus
2 pages
Essentials of Big Data Griet
No ratings yet
Essentials of Big Data Griet
2 pages
BIG Data Syllabus
No ratings yet
BIG Data Syllabus
2 pages
It (r20) 4-1 Big Data Analytics Digital Notes
No ratings yet
It (r20) 4-1 Big Data Analytics Digital Notes
84 pages
Bigdata
No ratings yet
Bigdata
2 pages
Big Data Management Syllabus
100% (1)
Big Data Management Syllabus
5 pages
Appendix-74
No ratings yet
Appendix-74
42 pages
BDA_DIGITAL NOTES
No ratings yet
BDA_DIGITAL NOTES
85 pages
PCAC2009
No ratings yet
PCAC2009
3 pages
Syllabus
No ratings yet
Syllabus
2 pages
CIT 4401Big Data Analytics Course Outline
No ratings yet
CIT 4401Big Data Analytics Course Outline
5 pages
Big Data Hadoop Certification Training: About Intellipaat
No ratings yet
Big Data Hadoop Certification Training: About Intellipaat
13 pages
Big Data Analytics - notes
No ratings yet
Big Data Analytics - notes
13 pages
Koe097big Data
No ratings yet
Koe097big Data
1 page
Mastering Big Data and Hadoop: From Basics to Expert Proficiency
From Everand
Mastering Big Data and Hadoop: From Basics to Expert Proficiency
William Smith
No ratings yet
Real-Time Big Data Analytics: Emerging Trends
From Everand
Real-Time Big Data Analytics: Emerging Trends
Trilokesh Khatri
No ratings yet
Data Science Unveiled: A Practical Guide to Key Techniques
From Everand
Data Science Unveiled: A Practical Guide to Key Techniques
Ed A Norex
No ratings yet
Data Modeler Resume
No ratings yet
Data Modeler Resume
5 pages
ISE-4th-Sem-Revised-Syllabus2023-24 (1)
No ratings yet
ISE-4th-Sem-Revised-Syllabus2023-24 (1)
30 pages
Solution Methodology
No ratings yet
Solution Methodology
5 pages
Sri Indu College of Engineering & Technology: Email Address
No ratings yet
Sri Indu College of Engineering & Technology: Email Address
11 pages
03-database-management-system-important-questions-answers (1)
No ratings yet
03-database-management-system-important-questions-answers (1)
35 pages
468 - DM Bok 2
No ratings yet
468 - DM Bok 2
157 pages
Assignment 1 5
No ratings yet
Assignment 1 5
4 pages
E_S4HCON2023 40_Q
No ratings yet
E_S4HCON2023 40_Q
23 pages
Ip-Dbms-Sql Assignment
No ratings yet
Ip-Dbms-Sql Assignment
4 pages
Hospital Final Report
No ratings yet
Hospital Final Report
33 pages
Avamar
No ratings yet
Avamar
4 pages
Overall Project Memorandum 1.2.2 Computerized Maintenance Management System Assessment Final Draft
No ratings yet
Overall Project Memorandum 1.2.2 Computerized Maintenance Management System Assessment Final Draft
67 pages
Campus Recruitment System
No ratings yet
Campus Recruitment System
5 pages
How To Integrate Oracle APEX With Subversion
No ratings yet
How To Integrate Oracle APEX With Subversion
19 pages
Database Individual Assignment
No ratings yet
Database Individual Assignment
2 pages
MIS Mid-Term
No ratings yet
MIS Mid-Term
12 pages
Unit 3 Query Languages 2 SQL
No ratings yet
Unit 3 Query Languages 2 SQL
58 pages
Pre-Board CS-Final
No ratings yet
Pre-Board CS-Final
11 pages
Final Draft Data Management and Record Keeping Standard Operating Procedure
No ratings yet
Final Draft Data Management and Record Keeping Standard Operating Procedure
5 pages
Chapter 5
No ratings yet
Chapter 5
47 pages
Vector DB Export Paper
No ratings yet
Vector DB Export Paper
2 pages
CRM Siebel Siebel Software Basics Oracle CRM: Windows Server 2012
No ratings yet
CRM Siebel Siebel Software Basics Oracle CRM: Windows Server 2012
1 page
Fraud Detection Using Machine Learning and Deep Learning: December 2019
No ratings yet
Fraud Detection Using Machine Learning and Deep Learning: December 2019
7 pages
07.User Defined Records-Functins and Procedures
No ratings yet
07.User Defined Records-Functins and Procedures
24 pages
IICS July2024 DataIntegrationPerformanceTuning en
100% (1)
IICS July2024 DataIntegrationPerformanceTuning en
41 pages
Oracle-Fusion-Cloud-Technical Sample Resume-2
No ratings yet
Oracle-Fusion-Cloud-Technical Sample Resume-2
5 pages
Transactions
No ratings yet
Transactions
89 pages
KavithaPugal Main 20240727
No ratings yet
KavithaPugal Main 20240727
4 pages
Data Analytics Master Class Course Content Updated 22 10 2024
No ratings yet
Data Analytics Master Class Course Content Updated 22 10 2024
48 pages

2024 25 ODD CE449 BDA Syllabus

Uploaded by

2024 25 ODD CE449 BDA Syllabus

Uploaded by

CE449: BIG DATA ANALYTICS

Credits and Hours:

Teaching Scheme Theory Practical Tutorial Total Credit

● Apply different technique for various sector of Big Data Analytics

Outline of the Course:

Sr. No Course Outcomes (Cos) Employability/

2. Acquire fundamental enabling techniques and scalable

Course Articulation Matrix:

Enter correlation levels 1, 2 or 3 as defined below:

Recommended Study Material:

You might also like