Koe097big Data

The document provides details on the syllabus for a course on big data. It includes 5 units covering topics like Hadoop, HDFS, MapReduce, YARN, Spark and other big data tools. Each unit lists the topics to be covered and the proposed number of lectures.

Uploaded by

Vimal Kumar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

32 views1 page

Koe097big Data

Uploaded by

Vimal Kumar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 1

KOE097: BIG DATA

DETAILED SYLLABUS 3-1-0

Unit Topic Proposed
Lecture
I Introduction to Big Data: Types of digital data, history of Big Data innovation, 08
introduction to Big Data platform, drivers for Big Data, Big Data architecture and
characteristics, 5 Vs of Big Data, Big Data technology components, Big Data
importance and applications, Big Data features – security, compliance, auditing and
protection, Big Data privacy and ethics, Big Data Analytics, Challenges of
conventional systems, intelligent data analysis, nature of data, analytic processes
and tools, analysis vs reporting, modern data analytic tools.
II Hadoop: History of Hadoop, Apache Hadoop, the Hadoop Distributed File System, 08
components of Hadoop, data format, analyzing data with Hadoop, scaling out,
Hadoop streaming, Hadoop pipes, Hadoop Echo System.
Map-Reduce: Map-Reduce framework and basics, how Map Reduce works,
developing a Map Reduce application, unit tests with MR unit, test data and local
tests, anatomy of a Map Reduce job run, failures, job scheduling, shuffle and sort,
task execution, Map Reduce types, input formats, output formats, Map Reduce
features, Real-world Map Reduce
III HDFS (Hadoop Distributed File System): Design of HDFS, HDFS concepts, 08
benefits and challenges, file sizes, block sizes and block abstraction in HDFS, data
replication, how does HDFS store, read, and write files, Java interfaces to HDFS,
command line interface, Hadoop file system interfaces, data flow, data ingest with
Flume and Scoop, Hadoop archives, Hadoop I/O: Compression, serialization, Avro
and file-based data structures. Hadoop Environment: Setting up a Hadoop cluster,
cluster specification, cluster setup and installation, Hadoop configuration, security
in Hadoop, administering Hadoop, HDFS monitoring & maintenance, Hadoop
benchmarks, Hadoop in the cloud
IV Hadoop Eco System and YARN: Hadoop ecosystem components, schedulers, fair 08
and capacity, Hadoop 2.0 New Features – Name Node high availability, HDFS
federation, MRv2, YARN, Running MRv1 in YARN.
NoSQL Databases: Introduction to NoSQL MongoDB: Introduction, data types,
creating, updating and deleing documents, querying, introduction to indexing,
capped collections
Spark: Installing spark, spark applications, jobs, stages and tasks, Resilient
Distributed Databases, anatomy of a Spark job run, Spark on YARN
SCALA: Introduction, classes and objects, basic types and operators, built-in
control structures, functions and closures, inheritance.
V Hadoop Eco System Frameworks: Applications on Big Data using Pig, Hive and 08
HBase
Pig : Introduction to PIG, Execution Modes of Pig, Comparison of Pig with
Databases, Grunt, Pig Latin, User Defined Functions, Data Processing operators,
Hive - Apache Hive architecture and installation, Hive shell, Hive services, Hive
metastore, comparison with traditional databases, HiveQL, tables, querying data and
user defined functions, sorting and aggregating, Map Reduce scripts, joins &
subqueries.
HBase – Hbase concepts, clients, example, Hbase vs RDBMS, advanced usage,
schema design, advance indexing, Zookeeper – how it helps in monitoring a cluster,
how to build applications with Zookeeper. IBM Big Data strategy, introduction to
Infosphere, BigInsights and Big Sheets, introduction to Big SQL.
Suggested Readings:
1. Michael Minelli, Michelle Chambers, and Ambiga Dhiraj, "Big Data, Big Analytics: Emerging Business Intelligence
and Analytic Trends for Today's Businesses", Wiley.
2. Big-Data Black Book, DT Editorial Services, Wiley.
3. Dirk deRoos, Chris Eaton, George Lapis, Paul Zikopoulos, Tom Deutsch, “Understanding Big Data Analytics for
Enterprise Class Hadoop and Streaming Data”, McGrawHill.
4. Thomas Erl, Wajid Khattak, Paul Buhler, “Big Data Fundamentals: Concepts, Drivers and Techniques”, Prentice Hall.

Open Elective List (VIII Semester) 2021-22 Page 20

Big Data Analytics
No ratings yet
Big Data Analytics
131 pages
Data Bots Training Courses
100% (1)
Data Bots Training Courses
36 pages
Bca Bigdata Fifth - Sem Approved Syllabus
No ratings yet
Bca Bigdata Fifth - Sem Approved Syllabus
23 pages
Big Data Analytics (R18a0529)
No ratings yet
Big Data Analytics (R18a0529)
134 pages
Big Data Analytics-Digital Notes
No ratings yet
Big Data Analytics-Digital Notes
86 pages
Big Data Analytics Syllabus - 22UAI603C - 204 - 2025
No ratings yet
Big Data Analytics Syllabus - 22UAI603C - 204 - 2025
2 pages
Big Data Analytics Digital Notes
No ratings yet
Big Data Analytics Digital Notes
119 pages
Big Data Analytics - Sem 7 CVMU
No ratings yet
Big Data Analytics - Sem 7 CVMU
4 pages
Syllabus
No ratings yet
Syllabus
7 pages
Big Data Analytics
No ratings yet
Big Data Analytics
61 pages
MCAD2232 (PRESS) BIG DATA and Its Applications
No ratings yet
MCAD2232 (PRESS) BIG DATA and Its Applications
140 pages
No SQL Database in Bda
No ratings yet
No SQL Database in Bda
84 pages
BDA Courseplan
No ratings yet
BDA Courseplan
3 pages
Bda Unit 2
No ratings yet
Bda Unit 2
57 pages
Data Science Design
No ratings yet
Data Science Design
299 pages
1-Big Data Systems, Programming and Management
No ratings yet
1-Big Data Systems, Programming and Management
3 pages
BE AIDS R 20 VII VIII Sem Syllabus - Compressed
No ratings yet
BE AIDS R 20 VII VIII Sem Syllabus - Compressed
55 pages
22IS61 Big Data Analytics 2025
No ratings yet
22IS61 Big Data Analytics 2025
4 pages
20IT503 - Big Data Analytics - Unit4
No ratings yet
20IT503 - Big Data Analytics - Unit4
73 pages
Ccs334 Big Data Analytics
0% (1)
Ccs334 Big Data Analytics
2 pages
Principles of Information Security, Fifth Edition: Risk Management
100% (2)
Principles of Information Security, Fifth Edition: Risk Management
32 pages
Big Data Analytics
No ratings yet
Big Data Analytics
20 pages
BD Course Handout
No ratings yet
BD Course Handout
5 pages
Big Data Analytics
No ratings yet
Big Data Analytics
2 pages
Information Technology Engineering Syllabus Sem Viii Mumbai University
No ratings yet
Information Technology Engineering Syllabus Sem Viii Mumbai University
60 pages
Unit 1
No ratings yet
Unit 1
19 pages
IV Yr II Sem Lesson Plans
No ratings yet
IV Yr II Sem Lesson Plans
19 pages
2021 22 4th Year
No ratings yet
2021 22 4th Year
8 pages
Self Study Nautical Science
100% (1)
Self Study Nautical Science
12 pages
BDA - Unit-1
No ratings yet
BDA - Unit-1
24 pages
Introduction To Data Analytics Syllabus
No ratings yet
Introduction To Data Analytics Syllabus
3 pages
SEM VII BDA Syllabus Theory
No ratings yet
SEM VII BDA Syllabus Theory
4 pages
BDA Syllabus - Sem VII - Mumbai University
No ratings yet
BDA Syllabus - Sem VII - Mumbai University
3 pages
Essentials of Big Data Griet
No ratings yet
Essentials of Big Data Griet
2 pages
Specialised Programme On Big Data and Machine Learning - 8 Weeks
No ratings yet
Specialised Programme On Big Data and Machine Learning - 8 Weeks
6 pages
Big Data and Analytics Syllabus 2021
No ratings yet
Big Data and Analytics Syllabus 2021
3 pages
Course Pack BDA
No ratings yet
Course Pack BDA
6 pages
CCS334 BDA Syllabus
No ratings yet
CCS334 BDA Syllabus
5 pages
B.Tech. CS - CE and CSE Syllabus 3rd Year 2024-25
No ratings yet
B.Tech. CS - CE and CSE Syllabus 3rd Year 2024-25
2 pages
(Ebook) The Book of Delights: Essays by Ross Gay ISBN 9781616207922, 1616207922
No ratings yet
(Ebook) The Book of Delights: Essays by Ross Gay ISBN 9781616207922, 1616207922
65 pages
Gujarat Technological University: Sr. No. Content Total Hrs % Weightage 1 13
No ratings yet
Gujarat Technological University: Sr. No. Content Total Hrs % Weightage 1 13
3 pages
LP BigData
No ratings yet
LP BigData
5 pages
RCIA - Week 07 Ecclesiology (Powerpoint Presentation)
No ratings yet
RCIA - Week 07 Ecclesiology (Powerpoint Presentation)
69 pages
BD Course Handout (Spring 2024)
No ratings yet
BD Course Handout (Spring 2024)
4 pages
The Elements of Graphic Design, Second Edition: Alexander W. White
No ratings yet
The Elements of Graphic Design, Second Edition: Alexander W. White
11 pages
Question Bank Big Data Analytics
No ratings yet
Question Bank Big Data Analytics
2 pages
Big Data analyticsNEW SYLLABUS FRAMING
No ratings yet
Big Data analyticsNEW SYLLABUS FRAMING
3 pages
FINAL SCRIPT WIZARD OF OZ
No ratings yet
FINAL SCRIPT WIZARD OF OZ
7 pages
Syllabus
No ratings yet
Syllabus
2 pages
Kingsbury Bulletin PDF
No ratings yet
Kingsbury Bulletin PDF
40 pages
Introduction Big Data With Hadoop
No ratings yet
Introduction Big Data With Hadoop
3 pages
Syllabus
No ratings yet
Syllabus
3 pages
Big Data Technologies Course Outline
No ratings yet
Big Data Technologies Course Outline
2 pages
Syllabus
No ratings yet
Syllabus
3 pages
iitG-Big Data (Old Syllabus)
No ratings yet
iitG-Big Data (Old Syllabus)
2 pages
Internship Weekly Journals
No ratings yet
Internship Weekly Journals
20 pages
SYLLABUS
No ratings yet
SYLLABUS
2 pages
Big Data Analytics
No ratings yet
Big Data Analytics
3 pages
Big Data and Hadoop For Developers - Syllabus
No ratings yet
Big Data and Hadoop For Developers - Syllabus
6 pages
Big Data Analytics With Lab
No ratings yet
Big Data Analytics With Lab
3 pages
Syllabus Big Data Analytics
No ratings yet
Syllabus Big Data Analytics
2 pages
Big Data Analytics Comp Syllabus Sem7
No ratings yet
Big Data Analytics Comp Syllabus Sem7
4 pages
Syllabus E63 Spring2016-2
No ratings yet
Syllabus E63 Spring2016-2
3 pages
20 MUST KNOW Things About Amazon EC2
No ratings yet
20 MUST KNOW Things About Amazon EC2
65 pages
Big Data Analytics Syllabus
No ratings yet
Big Data Analytics Syllabus
2 pages
Syllabus: Chandigarh University, Gharuan
No ratings yet
Syllabus: Chandigarh University, Gharuan
2 pages
Syllabus of Big Data Analysis - Proposed
No ratings yet
Syllabus of Big Data Analysis - Proposed
2 pages
DATA ANALYTICS Lab
No ratings yet
DATA ANALYTICS Lab
3 pages
10-ĐỀ - 22 bản
No ratings yet
10-ĐỀ - 22 bản
33 pages
The Snake Charmer A Life and Death in Pursuit of Knowledge 1ST Edition Jamie James - The Full Ebook Version Is Just One Click Away
No ratings yet
The Snake Charmer A Life and Death in Pursuit of Knowledge 1ST Edition Jamie James - The Full Ebook Version Is Just One Click Away
57 pages
The Medium Access Sublayer
No ratings yet
The Medium Access Sublayer
80 pages
Abc Powder Stored Pressure: Fire Extinguisher
No ratings yet
Abc Powder Stored Pressure: Fire Extinguisher
4 pages
MVRDV and Interior Urbanism - An Interview With Winy Maas - ArchDaily
No ratings yet
MVRDV and Interior Urbanism - An Interview With Winy Maas - ArchDaily
17 pages
(EE476) (Lab 1) 09ece - Group8
No ratings yet
(EE476) (Lab 1) 09ece - Group8
20 pages
Running Head: TEST QUESTIONS
No ratings yet
Running Head: TEST QUESTIONS
7 pages
Deforestation
No ratings yet
Deforestation
30 pages
From permanent employment to massive lay-offs the political economy of transitional unemployment in urban China 1993 8 - 副本
No ratings yet
From permanent employment to massive lay-offs the political economy of transitional unemployment in urban China 1993 8 - 副本
20 pages
Intern Data Scientist Data Sciences Analytics Job Description 0026
No ratings yet
Intern Data Scientist Data Sciences Analytics Job Description 0026
3 pages
LATHE New
No ratings yet
LATHE New
19 pages
Fourier Transform Properties
No ratings yet
Fourier Transform Properties
6 pages
Quiz #4 - UZB314E Heat Transfer (22822) 2023-2024 Spring Semester
No ratings yet
Quiz #4 - UZB314E Heat Transfer (22822) 2023-2024 Spring Semester
2 pages
Simplifying Fibromyalgia Assessment: The VASFIQ Brief Symptom Scale
No ratings yet
Simplifying Fibromyalgia Assessment: The VASFIQ Brief Symptom Scale
12 pages
IATF Resolution No 92
No ratings yet
IATF Resolution No 92
4 pages
Yama - Wikipedia: Skip To Main Content Accessibility Feedback
No ratings yet
Yama - Wikipedia: Skip To Main Content Accessibility Feedback
10 pages
Assignment2 w2010 Solutions
No ratings yet
Assignment2 w2010 Solutions
3 pages
9CH. Possibility and Obligation
No ratings yet
9CH. Possibility and Obligation
4 pages
Computernetwoektext
No ratings yet
Computernetwoektext
9 pages
Corbin Fisher - Sheet1
No ratings yet
Corbin Fisher - Sheet1
4 pages
CT1 and CT2 Master Seating Plan
No ratings yet
CT1 and CT2 Master Seating Plan
2 pages
World 1 What Is Animal Welfare and Why Is It Important
No ratings yet
World 1 What Is Animal Welfare and Why Is It Important
8 pages
Haemophilus and Fastidious
No ratings yet
Haemophilus and Fastidious
9 pages
QB Chap 1 Word
No ratings yet
QB Chap 1 Word
3 pages
Bins R2
No ratings yet
Bins R2
2 pages
Mahmoud Ahmed Wanes-4
No ratings yet
Mahmoud Ahmed Wanes-4
1 page
Xlift Workout Plan PDF
No ratings yet
Xlift Workout Plan PDF
1 page
Hadoop Ecosystem for Big Data
From Everand
Hadoop Ecosystem for Big Data
Dr. Zemelak Goraga
No ratings yet
Advanced Hadoop Techniques: A Comprehensive Guide to Mastery
From Everand
Advanced Hadoop Techniques: A Comprehensive Guide to Mastery
Adam Jones
No ratings yet

Koe097big Data

Uploaded by

Koe097big Data

Uploaded by

KOE097: BIG DATA

DETAILED SYLLABUS 3-1-0

Open Elective List (VIII Semester) 2021-22 Page 20

You might also like