Big Data Analytics-Syllabus

This document outlines a course on Big Data Analytics that is a core course. It includes 3 contact hours per week and carries 3 credits. The prerequisites are Data Mining. The course objectives are to explore big data concepts, analyze big data using techniques, understand MapReduce applications, and introduce analytics tools. The course is divided into 5 units covering introductions to big data and analytics lifecycles, advanced analytical methods in R, Hadoop, and advanced analytics tools like Pig and Hive.

Uploaded by

Dual Dave

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

149 views

Big Data Analytics-Syllabus

Uploaded by

Dual Dave

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

Course Code Course Title Category

17BTIS702 Big Data Analytics Core

Contact Hours per Week

CA FE Credits
L T D/P

3 0 0 40 60 3

Prerequisite: Data Mining

Course Objectives: ( 3 to 5 ):
1. To explore the fundamental concepts of big data analytics.
2. To learn to analyze the big data using different techniques.
3. To understand the applications using Map Reduce Concepts.
4. To introduce programming tools for data analytics

: Big Data Analytics

CA : 40 Marks FE : 60 Marks No. of Total Lectures = 45 Hours

Unit 1 Introduction to big data 9 MKS

Big data overview, BI versus data science, current analytical architecture, emerging big data
ecosystem and new approach to analytics, key roles for new big data ecosystem, big data
analytics examples, analysis vs reporting

Details: In this unit case study of flipkart, amazon, twitter, Facebook, etc. from big data
characteristics point of view needs to be taken. The students should be able to comment on
volume, data type, density of data, verocity, velocity of data for different applications. Discuss
with students the big data characteristics for different applications. Students can give
presentations of same and the course instructor can discuss it in class. (minimum three case
studies)

Unit 2 Data Analytics Lifecycle Overview 9 MKS

Key Roles for a Successful Analytics Project , Background and Overview of Data Analytics
Lifecycle/e , Phase 1: Discovery ,Phase 2: Data Preparation ,Phase 3: Model Planning , Phase 4:
Model Building ,Phase 5: Communicate Results , Phase 6: Operationalize , Case Study: Global
Innovation Network and Analysis (GINA)

Details: In this unit case study of flipkart, amazon, twitter, Facebook, etc. should be taken. The
course instructor should present an analytical plan for any one business problem related to any
application. A group of students can present analytical plan for different applications. Discuss
the analytical plan given by students in the class. (minimum 3 plans needs to be discussed)

Unit 3 Advanced Analytical methods 9 MKS

Basic data analytics method using R - Introduction to R , Exploratory Data analysis , statistical
methods for evaluation; Clustering Overview , K- Means , advanced clustering algorithms ;
Linear regression , logistic regression , advanced regression models ; Text Analysis – TFIDF ,
Categorizing documents by topics , determining sentiments , gaining insights

Details : Reference 1:
K-means, determining clusters in kmeans, reasons to choose and caution, linear regression
model in detail, logistic regression in detail, customer churn case study, reason to choose and
caution for regression models, chapter 9 in details from Reference 1

Unit 4 Hadoop 9
MKS
History of Hadoop- the Hadoop Distributed File System – Components of Hadoop Analyzing the
Data with Hadoop- Scaling Out- Hadoop Streaming- Design of HDFS- How Map Reduce
Works-Anatomy of a Map Reduce Job run-Failures-Job Scheduling-Shuffle and Sort – Apache
Spark , Spark ML libraries
Details : Reference 3
Chapter 1 – brief history of Hadoop, Chapter 2 – weather dataset, analyzing data using unix
tools, analyzing the data with Hadoop, scaling out, chapter 3 – design of hdfs, hdfs concept, data
flow, anatomy of file read, anatomy of file write, Chapter 6 – all topics.
Unit 5 Advanced Analytics - Tools and technology 9 MKS
Applications on Big Data Using Pig and Hive – Data processing operators in Pig – Hive services
– HiveQL – Querying Data in Hive - fundamentals of HBase and ZooKeeper, .Flume, SQOOP
Details: The architecture, functionalities, limitations of each tool, differences between different
tools. Reference 3 and Reference 1 can be used. The unit should have taught from more practical
approach rather than theory.

References:
1. Data Science & Big Data Analytics, Discovering, Analyzing, Visualizing and Presenting
Data , EMC Education Services, WILEY, ISBN: 978-1-118-87613-8 January
2015 432 Pages
2. Chris Eaton, Dirk deroos et al. “Understanding Big data ”, McGraw Hill, 2012
3. Tom White “Hadoop: The Definitive Guide” Third Edition, O’reilly Media, 2012.
4. Boris lublinsky, Kevin t. Smith, Alexey Yakubovich, “Professional Hadoop Solutions”,
Wiley, ISBN: 9788126551071, 2015.
5. Beginning Apache Spark 2: With Resilient Distributed Datasets, Spark SQL, Structured
Streaming and Spark Machine Learning library by Hien Luu , Apress
6. Using Flume , by Hari Shreedharan , Released September 2014 , Publisher(s): O'Reilly
Media, Inc. ,ISBN: 9781449368302
7. Apache Sqoop Cookbook, by Kathleen Ting, Jarek Jarcec Cecho,Released July
2013,Publisher(s): O'Reilly Media, Inc.,ISBN: 9781449364625

Outcomes:
Students will be able to:
1. Work with big data platform and explore the big data analytics techniques business
applications.
2. Design efficient algorithms for mining the data from large volumes and analyzing of the
data and extracting knowledge.
3. Analyze the HADOOP and Map Reduce technologies associated with big data analytics.
4. Explore on Big Data applications Using Pig and Hive.
5. Understand the fundamentals of various big data analytics techniques.

Data Analytics Quantum
75% (4)
Data Analytics Quantum
142 pages
Data Science and Big Data Analytics
No ratings yet
Data Science and Big Data Analytics
2 pages
The - Influence - of - Social - Media - On - Consumer - Behavior PDF
100% (1)
The - Influence - of - Social - Media - On - Consumer - Behavior PDF
128 pages
3174207
No ratings yet
3174207
4 pages
Syllabus of Course Big Data Integration
No ratings yet
Syllabus of Course Big Data Integration
9 pages
Big Data Analytics
No ratings yet
Big Data Analytics
3 pages
Unit 1-Big Data Analytics & Lifecycle
No ratings yet
Unit 1-Big Data Analytics & Lifecycle
130 pages
2023 HIT2203-Course outline
No ratings yet
2023 HIT2203-Course outline
6 pages
Common To B.E / B.Tech. - CS & IT Programmes
No ratings yet
Common To B.E / B.Tech. - CS & IT Programmes
1 page
Big Data Analytics
No ratings yet
Big Data Analytics
19 pages
HIT2203 Course Outline
No ratings yet
HIT2203 Course Outline
6 pages
BDA_Notes
No ratings yet
BDA_Notes
68 pages
17ci18 - Big Data Analytics
No ratings yet
17ci18 - Big Data Analytics
2 pages
Syllabus
No ratings yet
Syllabus
3 pages
Pemanfaatan Big Data Dalam Riset 2023
No ratings yet
Pemanfaatan Big Data Dalam Riset 2023
47 pages
Bigdata
No ratings yet
Bigdata
2 pages
310251: Data Science and Big Data Analytics
No ratings yet
310251: Data Science and Big Data Analytics
2 pages
Big Data Management Syllabus
100% (1)
Big Data Management Syllabus
5 pages
CS8091-Big-Data-Analytics
No ratings yet
CS8091-Big-Data-Analytics
28 pages
Appendix-74
No ratings yet
Appendix-74
42 pages
Da Quantum
No ratings yet
Da Quantum
143 pages
Big Data-2
No ratings yet
Big Data-2
3 pages
Data Science and Big Data Analytics_ Unit_1
No ratings yet
Data Science and Big Data Analytics_ Unit_1
47 pages
BCA-BIGDATA-FIFTH_SEM-APPROVED-SYLLABUS
No ratings yet
BCA-BIGDATA-FIFTH_SEM-APPROVED-SYLLABUS
23 pages
E - TC and Elex - Syllabus - 4102017 PDF
No ratings yet
E - TC and Elex - Syllabus - 4102017 PDF
3 pages
Zero Lecture: Big Data Analytics Lab BCA04206 From: Megha Garg
No ratings yet
Zero Lecture: Big Data Analytics Lab BCA04206 From: Megha Garg
19 pages
3.1.1
No ratings yet
3.1.1
7 pages
ip kvs
No ratings yet
ip kvs
92 pages
Xii Ip Study Material
No ratings yet
Xii Ip Study Material
92 pages
DAV Quantum
No ratings yet
DAV Quantum
143 pages
ITECH2302 MainAssessment Report
No ratings yet
ITECH2302 MainAssessment Report
8 pages
Course Outline PDF
No ratings yet
Course Outline PDF
4 pages
Big Data Syllabus
No ratings yet
Big Data Syllabus
6 pages
326E5E
No ratings yet
326E5E
2 pages
paper-solution-BDA
No ratings yet
paper-solution-BDA
15 pages
Knowledge Discovery Data Mining - Syllabus
No ratings yet
Knowledge Discovery Data Mining - Syllabus
6 pages
GreyAtom FSDSE Brochure PDF
No ratings yet
GreyAtom FSDSE Brochure PDF
25 pages
Big Data Manual - Edited
No ratings yet
Big Data Manual - Edited
69 pages
Data Analytics Quantum
No ratings yet
Data Analytics Quantum
144 pages
4 2 PDF
No ratings yet
4 2 PDF
2 pages
Kadir
No ratings yet
Kadir
80 pages
Question Paper DSBDA
No ratings yet
Question Paper DSBDA
16 pages
Tugas Analitika Data (Yasa Hapipudin)
No ratings yet
Tugas Analitika Data (Yasa Hapipudin)
4 pages
B.Tech Jntuh DWDM Course Description
No ratings yet
B.Tech Jntuh DWDM Course Description
6 pages
CS8091 BDA Unit1
No ratings yet
CS8091 BDA Unit1
63 pages
Data Mining & Warehousing Exam
No ratings yet
Data Mining & Warehousing Exam
28 pages
BDA - Unit-1
No ratings yet
BDA - Unit-1
24 pages
ARG 3203 Big Data Analytics Course Outline
No ratings yet
ARG 3203 Big Data Analytics Course Outline
2 pages
22IS61 Big data analytics 2025
No ratings yet
22IS61 Big data analytics 2025
4 pages
PPT 1.1.1
No ratings yet
PPT 1.1.1
13 pages
Bite411l Big-data-Analytics TH 1.0 73 Bite411l 67 Acp
No ratings yet
Bite411l Big-data-Analytics TH 1.0 73 Bite411l 67 Acp
2 pages
2nd - Semester - Data Science - Modified
No ratings yet
2nd - Semester - Data Science - Modified
14 pages
Ut Dallas - Big Data Analytics Management Syl33611
No ratings yet
Ut Dallas - Big Data Analytics Management Syl33611
9 pages
Data Mining and Business Intelligence
No ratings yet
Data Mining and Business Intelligence
4 pages
CHO AI 105 - Data Analytics-As Shared
No ratings yet
CHO AI 105 - Data Analytics-As Shared
8 pages
Datascience Slide preparation notes
No ratings yet
Datascience Slide preparation notes
3 pages
Bda Aids Syllabus
No ratings yet
Bda Aids Syllabus
3 pages
4.7.1 BDA-MBA
No ratings yet
4.7.1 BDA-MBA
2 pages
BCSE206L_FOUNDATIONS-OF-DATA-SCIENCE_TH_1.0_71_BCSE206L_66 ACP
No ratings yet
BCSE206L_FOUNDATIONS-OF-DATA-SCIENCE_TH_1.0_71_BCSE206L_66 ACP
2 pages
Question Bank R
No ratings yet
Question Bank R
19 pages
Data Science Mastery: From Beginner to Expert in Big Data Analytics
From Everand
Data Science Mastery: From Beginner to Expert in Big Data Analytics
Kameron Hussain
No ratings yet
TSR Overview
No ratings yet
TSR Overview
16 pages
Assignment 2 Pranav Badhe
No ratings yet
Assignment 2 Pranav Badhe
12 pages
Assignment 1
No ratings yet
Assignment 1
1 page
Unit 3 and 4 QB
No ratings yet
Unit 3 and 4 QB
1 page
Flurn Web or Mobile App Development - Leave Management
No ratings yet
Flurn Web or Mobile App Development - Leave Management
3 pages
Flurn Assignment - Backend Developer
No ratings yet
Flurn Assignment - Backend Developer
3 pages
COE Guidelines - Hiring Pattern FY22
No ratings yet
COE Guidelines - Hiring Pattern FY22
5 pages
ADV GET PGET Hiring Program
No ratings yet
ADV GET PGET Hiring Program
4 pages
JD - Full Stack Developer - Campus
No ratings yet
JD - Full Stack Developer - Campus
1 page
Drive Details JD
No ratings yet
Drive Details JD
2 pages
Book 3122
No ratings yet
Book 3122
3 pages
PSRM II Assingment 6
No ratings yet
PSRM II Assingment 6
2 pages
AyeshabiTigdikar Resume
No ratings yet
AyeshabiTigdikar Resume
1 page
Data Analytics Process
No ratings yet
Data Analytics Process
10 pages
Compete Thesis of ASAD
No ratings yet
Compete Thesis of ASAD
40 pages
Bahasa Inggris Muhammad Fajriyansyah
No ratings yet
Bahasa Inggris Muhammad Fajriyansyah
6 pages
7 Minitab Regression
No ratings yet
7 Minitab Regression
18 pages
Dialnet AnExpandedPerspectiveOnAgendaSettingEffects 4508546 PDF
No ratings yet
Dialnet AnExpandedPerspectiveOnAgendaSettingEffects 4508546 PDF
18 pages
Daily Bazar Case Study
No ratings yet
Daily Bazar Case Study
8 pages
Week 5 Discussion 2 Algorithms of Cluster Analysis. 1) What Is K-Means From A Basic Standpoint?
No ratings yet
Week 5 Discussion 2 Algorithms of Cluster Analysis. 1) What Is K-Means From A Basic Standpoint?
4 pages
Normalization Book PDF
No ratings yet
Normalization Book PDF
181 pages
Bsa106 O1
No ratings yet
Bsa106 O1
4 pages
Why Are The Human Sciences Important
No ratings yet
Why Are The Human Sciences Important
17 pages
CHAPTER 12 - Non Parametrics Test
No ratings yet
CHAPTER 12 - Non Parametrics Test
38 pages
Limits of Simple Regression: Allen Downey
No ratings yet
Limits of Simple Regression: Allen Downey
43 pages
BIGDATA Pharmaceutical Industry
No ratings yet
BIGDATA Pharmaceutical Industry
7 pages
Sisters of Mary School - Adlas, Inc. Adlas, Silang, 4118 Cavite, Philippines
No ratings yet
Sisters of Mary School - Adlas, Inc. Adlas, Silang, 4118 Cavite, Philippines
13 pages
Fundamentals of Business Statistics
No ratings yet
Fundamentals of Business Statistics
2 pages
Chapter 3
No ratings yet
Chapter 3
22 pages
ANOVA Introduction
100% (3)
ANOVA Introduction
14 pages
Vijin PROJECT REPORT Front Page Original
No ratings yet
Vijin PROJECT REPORT Front Page Original
6 pages
GCLUTO - An Interactive Clustering, Visualization, and Analysis System
No ratings yet
GCLUTO - An Interactive Clustering, Visualization, and Analysis System
10 pages
Atharv Kulkarni Resume
No ratings yet
Atharv Kulkarni Resume
1 page
Research Proposal Rubric
No ratings yet
Research Proposal Rubric
2 pages
Exercise #7-Deli Depot-Differences
No ratings yet
Exercise #7-Deli Depot-Differences
3 pages
Final SBE-FINALS
No ratings yet
Final SBE-FINALS
11 pages
DAA - Chapter 01
No ratings yet
DAA - Chapter 01
14 pages
A Stochastic Model For Demand Forecating in Python
No ratings yet
A Stochastic Model For Demand Forecating in Python
32 pages
OceanofPDF.com Modern Data Science With R - Baumer Benjamin SKaplan Daniel THort
No ratings yet
OceanofPDF.com Modern Data Science With R - Baumer Benjamin SKaplan Daniel THort
985 pages
Unit VII Homework-Nastasskia Sy
No ratings yet
Unit VII Homework-Nastasskia Sy
14 pages

Big Data Analytics-Syllabus

Uploaded by

Big Data Analytics-Syllabus

Uploaded by

Course Code Course Title Category

17BTIS702 Big Data Analytics Core

Contact Hours per Week

Prerequisite: Data Mining

: Big Data Analytics

Unit 1 Introduction to big data 9 MKS

Unit 2 Data Analytics Lifecycle Overview 9 MKS

Unit 3 Advanced Analytical methods 9 MKS

You might also like