Analyzing Limitations and Solutions of Existing Data Analytics

Uploaded by

kshitijseven1

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

30 views21 pages

Analyzing Limitations and Solutions of Existing Data Analytics

Uploaded by

kshitijseven1

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 21

Analyzing limitations

and solutions of
existing data analytics
Dr. Vandana Bhatia
Objectives:
 Understanding Big data Analytics
 Difference between data analytics
and Big data analytics
 Limitations
 Solutions
Big Data Challenges
Big Data Challenges
Why to put Big Data and analytics together?

➢ Big data provides gigantic statistical samples, which

enhance analytic tool results.
➢ Analytic tools and databases can now handle big data
➢ The economics of analytics is now more embraceable than
ever
➢ There’s a lot to learn from messy data, as long as it’s big.
➢ Big data is a special asset that merits leverage
➢ Analytics based on large data samples reveals and leverages
business change
Drivers and Enablers

Big Data

Business Technology
Need Advances

Analytical
Platforms
Technologies for Big Data
(and Analytics)

 Data warehouses
 Appliances
 Analytical sandboxes
 In-memory analytics
 In-database analytics
 Columnar databases
Technologies for Big Data (and Analytics)

Streaming and Critical Event

Processing (CEP) Engines
 Cloud-based services
 Non relational databases
 Hadoop/MapReduce
Hadoop/MapReduce

• Grew out of the efforts of Google, Yahoo, and

others to handle massive volumes of data

• Handles multi-structured data

• Process the data across commodity parallel

servers

• Open source software from the Apache

Software Foundation
1. Hadoop
• Apache Hadoop is the most prominent and used tool in big data
industry with its enormous capability of large-scale processing
data.
• This is 100% open source framework and runs on commodity
hardware in an existing data center. Furthermore, it can run
on a cloud infrastructure.
• Hadoop consists of four parts:
• Hadoop Distributed File System: Commonly known as HDFS,
it is a distributed file system compatible with very high scale
bandwidth.
• MapReduce: A programming model for processing big data.
• YARN: It is a platform used for managing and scheduling
Hadoop’s resources in Hadoop infrastructure.
• Libraries: To help other modules to work with Hadoop.
5. RapidMiner
• a software platform for data science activities and
provides an integrated environment for:
• Preparing data
• Machine learning
• Text mining
• Predictive analytics
• Deep learning
• Application development
• Prototyping
• RapidMiner follows a client/server model where the
server could be located on-premise, or in a cloud
infrastructure.
6. MongoDB
• MongoDB is an open source NoSQL database which is
cross-platform compatible with many built-in features.
• It runs on MEAN software stack, NET applications and,
Java platform.
• It can store any type of data like integer, string, array,
object, boolean, date etc.
• It provides flexibility in cloud-based infrastructure.
• It is flexible and easily partitions data across the servers
in a cloud structure.
• MongoDB uses dynamic schemas. Hence, you can prepare
data on the fly and quickly. This is another way of cost
saving.
R Programming Tool
• although used for statistical analysis, as a user you
don’t have to be a statistical expert.
• R has its own public library CRAN (Comprehensive R
Archive Network) which consists of more than 9000
modules and algorithms for statistical analysis of
data.
• R can run on Windows and Linux server as well inside
SQL server. It also supports Hadoop and Spark.
• Using R tool one can work on discrete data and try
out a new analytical algorithm for analysis.
• R model built and tested on a local data source can
be easily implemented in other servers or even
against a Hadoop data lake.
8. Neo4j
• Neo4j is one of the big data tools that is widely used
graph database in big data industry. It follows the
fundamental structure of graph database which is
interconnected node-relationship of data.
• It supports ACID (Atomicity, Consistency, Isolation,
Durability)transaction
• High availability
• Scalable and reliable
• Flexible as it does not need a schema or data type to
store data
• It can integrate with other databases
• Supports query language for graphs which is commonly
known as Cypher
Data
Scientists
Design and
implement
ation in
Applying 4A’s
advanced
program techniques in
ming and mathematics
developm and statistics
Analytical ent skills, to model data
and algorithm for deep
ethical developm analysis
Communi reasoning ent skills
cation skills
and
business
skills
Data
Architecture

Data 4 A’s of Data Data

Archival science Acquisition

Data
Analysis
For further reading :

https://www.educba.com/data-scientist-vs-big-data/

Terminologies Used in Big Data Environments
No ratings yet
Terminologies Used in Big Data Environments
3 pages
Big Data Components
No ratings yet
Big Data Components
31 pages
Big Data Analytics Unit-1
100% (2)
Big Data Analytics Unit-1
5 pages
Big Data Components
No ratings yet
Big Data Components
58 pages
Unit 1-BigDataTools
No ratings yet
Unit 1-BigDataTools
69 pages
Da Unit Ii
No ratings yet
Da Unit Ii
25 pages
Kwasu-csc204 Big Data Computing and Security-1
No ratings yet
Kwasu-csc204 Big Data Computing and Security-1
57 pages
Big Data
No ratings yet
Big Data
190 pages
CS8091 BDA Unit 1
No ratings yet
CS8091 BDA Unit 1
118 pages
BDA1-4 bunits
No ratings yet
BDA1-4 bunits
113 pages
unit II (3)
No ratings yet
unit II (3)
32 pages
Session 1
No ratings yet
Session 1
48 pages
BDA 02 - Fundamentals
No ratings yet
BDA 02 - Fundamentals
64 pages
BIG data1
No ratings yet
BIG data1
49 pages
Unit 1 Big Data
No ratings yet
Unit 1 Big Data
124 pages
Bigdata Notes
No ratings yet
Bigdata Notes
136 pages
Big Data complete Notes
No ratings yet
Big Data complete Notes
33 pages
Unit-1 Introduction to Data Analytics.pptx
No ratings yet
Unit-1 Introduction to Data Analytics.pptx
35 pages
Adbase Presentation Group 4
No ratings yet
Adbase Presentation Group 4
60 pages
Big Data Analytics M1
No ratings yet
Big Data Analytics M1
27 pages
Data Management & Data Architecture
No ratings yet
Data Management & Data Architecture
21 pages
Big Data Lec4
No ratings yet
Big Data Lec4
38 pages
DSA QB
No ratings yet
DSA QB
25 pages
Module 3 - Data Science
No ratings yet
Module 3 - Data Science
22 pages
Big-Data-A-Comprehensive-Overview
No ratings yet
Big-Data-A-Comprehensive-Overview
25 pages
Big Data Analytics Tools, BHARATH.S (Assignment-1)
No ratings yet
Big Data Analytics Tools, BHARATH.S (Assignment-1)
17 pages
Big Data Analytics Unit1
No ratings yet
Big Data Analytics Unit1
20 pages
Ds4015 Big Data Analytics QB
No ratings yet
Ds4015 Big Data Analytics QB
155 pages
Big Data Analytics
No ratings yet
Big Data Analytics
21 pages
R II Bca IV Sem Unit 3 Balu Sir
No ratings yet
R II Bca IV Sem Unit 3 Balu Sir
14 pages
Unit 1 Data Science and Big Data
No ratings yet
Unit 1 Data Science and Big Data
23 pages
Unit 1
No ratings yet
Unit 1
20 pages
BDA UNIT-I
No ratings yet
BDA UNIT-I
15 pages
Chapter 2 - Data Science
No ratings yet
Chapter 2 - Data Science
20 pages
MODULE 1 - ST
No ratings yet
MODULE 1 - ST
13 pages
DSBDA EndSem2023 12F FlyHigh
No ratings yet
DSBDA EndSem2023 12F FlyHigh
20 pages
Big Data Analytics
100% (3)
Big Data Analytics
79 pages
Big Data technologies UNIT 1
No ratings yet
Big Data technologies UNIT 1
5 pages
Big Data Concepts
No ratings yet
Big Data Concepts
15 pages
2 emerging
No ratings yet
2 emerging
10 pages
Unit-2
No ratings yet
Unit-2
15 pages
Introduction-It Skills
No ratings yet
Introduction-It Skills
20 pages
Big Data Analytics
No ratings yet
Big Data Analytics
8 pages
2.data Science Tools
No ratings yet
2.data Science Tools
13 pages
Types of Digital Data: Unit 1 Big Data KCS-061
No ratings yet
Types of Digital Data: Unit 1 Big Data KCS-061
12 pages
BDTools
No ratings yet
BDTools
15 pages
Datascience Tools
No ratings yet
Datascience Tools
6 pages
Unit I LM
No ratings yet
Unit I LM
12 pages
6th Sem Cse Data Science Analytics SM o
No ratings yet
6th Sem Cse Data Science Analytics SM o
40 pages
Ccs 334
No ratings yet
Ccs 334
16 pages
Cp5293 Big Data Analytics Question Bank
0% (1)
Cp5293 Big Data Analytics Question Bank
13 pages
Big Data BDO
No ratings yet
Big Data BDO
11 pages
Introduction to Big Data
No ratings yet
Introduction to Big Data
4 pages
Fda 1
No ratings yet
Fda 1
5 pages
A Review On Data Science Technologies
No ratings yet
A Review On Data Science Technologies
3 pages
Data Science Tools
No ratings yet
Data Science Tools
8 pages
Nokia Cloud Operations Manager - Data Sheet
No ratings yet
Nokia Cloud Operations Manager - Data Sheet
3 pages
Big Data Analytics
No ratings yet
Big Data Analytics
31 pages
Snmpinfo Md Internet
No ratings yet
Snmpinfo Md Internet
235 pages
FakeAVCeleb A Novel Audio-Video Multimodal DeepFake Dataset
No ratings yet
FakeAVCeleb A Novel Audio-Video Multimodal DeepFake Dataset
22 pages
ICT Grade 7 Pages Notes
No ratings yet
ICT Grade 7 Pages Notes
121 pages
MQTT Protocol
No ratings yet
MQTT Protocol
8 pages
cp5293 Big Data Analytics Question Bank
0% (1)
cp5293 Big Data Analytics Question Bank
13 pages
Self-Improvement Channel
100% (1)
Self-Improvement Channel
3 pages
Introduction to informatin technology
No ratings yet
Introduction to informatin technology
64 pages
Maya Manual Modelling Nurbs
No ratings yet
Maya Manual Modelling Nurbs
202 pages
User Manual W11 - Acer - 1.0 - A - A
No ratings yet
User Manual W11 - Acer - 1.0 - A - A
69 pages
ID Ticket Fecha ID Empleado ID Agente Categoría Tipo
No ratings yet
ID Ticket Fecha ID Empleado ID Agente Categoría Tipo
808 pages
Installation and Setup
No ratings yet
Installation and Setup
68 pages
CPE 101 Lecture 3 With Codes
No ratings yet
CPE 101 Lecture 3 With Codes
14 pages
Sim7600g Sim7600g-H Hardware Design v1.00
No ratings yet
Sim7600g Sim7600g-H Hardware Design v1.00
72 pages
Optiplex 3050 Desktop - Owners Manual2 - en Us PDF
No ratings yet
Optiplex 3050 Desktop - Owners Manual2 - en Us PDF
98 pages
Samplereusme
No ratings yet
Samplereusme
1 page
Wells Fargo Pitch Deck
No ratings yet
Wells Fargo Pitch Deck
20 pages
E-Commerce Practicle File Questions
No ratings yet
E-Commerce Practicle File Questions
4 pages
Computer Taleemi Calendar Class 6
No ratings yet
Computer Taleemi Calendar Class 6
4 pages
4.oracle Fusion Financials Final Course Content
No ratings yet
4.oracle Fusion Financials Final Course Content
18 pages
Resume Faiz 230221 180146
No ratings yet
Resume Faiz 230221 180146
4 pages
How To Use Teachable & Zoom - SEE THIS
No ratings yet
How To Use Teachable & Zoom - SEE THIS
21 pages
URC TCL Tool User Guide
No ratings yet
URC TCL Tool User Guide
40 pages
NPTEL CC Assignment 5
50% (2)
NPTEL CC Assignment 5
4 pages
Cisco Router Password Recovery
No ratings yet
Cisco Router Password Recovery
3 pages
WhatsApp Chat With +91 95874 11449
No ratings yet
WhatsApp Chat With +91 95874 11449
3 pages
Operating System Lab Manual: Ex - No:1.a Basics of Unix Commands Introduction To Unix
No ratings yet
Operating System Lab Manual: Ex - No:1.a Basics of Unix Commands Introduction To Unix
68 pages
A Few TEQC Tips For Getting Started: Beth Pratt-Sitaula (UNAVCO)
No ratings yet
A Few TEQC Tips For Getting Started: Beth Pratt-Sitaula (UNAVCO)
2 pages
Guide To x86 Assembly
No ratings yet
Guide To x86 Assembly
13 pages
01 Latihan Soal 1 Answered
No ratings yet
01 Latihan Soal 1 Answered
7 pages
Chad Kurdi: ETAP Tutorials, ETAP Training Videos - Coursovie
No ratings yet
Chad Kurdi: ETAP Tutorials, ETAP Training Videos - Coursovie
11 pages
Hadoop Ecosystem for Big Data
From Everand
Hadoop Ecosystem for Big Data
Dr. Zemelak Goraga
No ratings yet
Hadoop Blueprints
From Everand
Hadoop Blueprints
Anurag Shrivastava
No ratings yet

Analyzing Limitations and Solutions of Existing Data Analytics

Uploaded by

Analyzing Limitations and Solutions of Existing Data Analytics

Uploaded by

Analyzing limitations

➢ Big data provides gigantic statistical samples, which

Streaming and Critical Event

• Grew out of the efforts of Google, Yahoo, and

• Handles multi-structured data

• Process the data across commodity parallel

• Open source software from the Apache

Data 4 A’s of Data Data

You might also like