0% found this document useful (0 votes)

3 views

datascience

Data science is an interdisciplinary field that utilizes computer science, statistics, and domain knowledge to analyze data and inform decision-making. It is crucial for improving efficiency, enabling predictive analytics, and fostering innovation across various industries such as healthcare, finance, and marketing. The document outlines essential tools and methodologies for data scientists, including programming languages, data visualization tools, machine learning frameworks, and cloud platforms.

Uploaded by

arunbaditya1

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

3 views

datascience

Uploaded by

arunbaditya1

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 12

UNIT 1

Introduction
Data science is an interdisciplinary field that combines computer science, statistics, and domain
knowledge to extract insights and knowledge from structured and unstructured data. It involves
using scientific methods, algorithms, and systems to analyze and interpret complex data sets to
help inform decision-making, solve problems, and uncover patterns and trends.
Tools commonly used in data science include programming languages like Python and R, data
analysis libraries like Pandas, NumPy, and SciPy, machine learning frameworks like Scikit-
learn, TensorFlow, and PyTorch, and data visualization tools like Matplotlib, Seaborn, and
Tableau.

Importance of data Science

Data science is incredibly important in today's world because it enables organizations and
individuals to make better decisions, optimize processes, and uncover insights from large and
complex datasets. Here are some key reasons why data science is so crucial:
1. Informed Decision-Making: Data science helps businesses and organizations make
decisions based on data, rather than relying on gut feelings or assumptions. By analyzing
trends, patterns, and correlations in data, data scientists can provide actionable insights.
2. Predictive Power: Data science models can forecast future trends or behaviors. For
example, businesses can use data to predict customer behavior, optimize supply chains,
or anticipate market changes.
3. Improved Efficiency: By automating processes and identifying inefficiencies, data
science can streamline operations and save time and money. This can lead to improved
resource allocation and better overall performance.
4. Personalization: Data science enables the creation of personalized experiences. For
instance, recommendation systems (like those used by Netflix or Amazon) rely on data
science techniques to suggest products or content tailored to individual preferences.
5. Competitive Advantage: Companies that leverage data science often have a significant
edge over their competitors. By utilizing analytics, businesses can identify market
opportunities, reduce risks, and drive innovation.
6. Handling Big Data: As the amount of data generated globally increases, data science
provides the tools and techniques needed to process, analyze, and extract meaning from
vast datasets.
7. Innovation and New Discoveries: Data science is instrumental in fields like healthcare,
physics, and social sciences, where it can lead to breakthroughs in understanding and
innovation, such as discovering new drugs, diagnosing diseases, or understanding human
behavior.
8. Automation and AI: Data science is at the heart of machine learning and AI
technologies. These systems learn from data to improve over time, making them highly
valuable for applications like self-driving cars, chatbots, and virtual assistants.

Applications:
Data science is applied in various industries, including:
 Healthcare: Predicting patient outcomes, disease detection, and personalized medicine.
 Finance: Fraud detection, risk analysis, and algorithmic trading.
 Marketing: Customer segmentation, recommendation systems, and A/B testing.
 Tech: Speech recognition, autonomous systems, and image processing.

Data scientist’s tool box:

Turning data into actionable knowledge
Turning data into actionable knowledge in data science involves leveraging advanced analytical
methods, algorithms, and tools to extract meaningful insights that can be used for decision-
making, improving operations, and achieving business goals. Here’s how you would approach
this in the context of data science:
1. Problem Definition
 Clarify Objectives: The first step is understanding the problem you're trying to solve or
the decision you're trying to inform. This could involve increasing sales, predicting
customer churn, detecting fraud, etc.
 Set Clear Metrics: Define measurable outcomes to track progress. These could include
accuracy, precision, recall, or business-specific KPIs.
2. Data Collection and Preprocessing
 Data Acquisition: Gather data from different sources—internal databases, APIs, sensors,
or third-party providers.
 Data Cleaning: Clean the data by handling missing values, correcting errors, removing
duplicates, and normalizing the data. This is crucial for building trustworthy models.
 Feature Engineering: Identify and create features that will be useful for your model.
This might include aggregating, transforming, or deriving new variables that better
represent the problem.
3. Exploratory Data Analysis (EDA)
 Visualizations: Use visual tools like histograms, scatter plots, heatmaps, and box plots to
get a sense of the distribution of data and detect patterns or outliers.
 Statistical Analysis: Explore basic statistics to understand the relationships between
variables and test hypotheses.
 Correlation Analysis: Check for correlations between features to identify dependencies
that could be valuable for predictive modeling.
4. Modeling and Algorithm Selection
 Choose the Right Models: Depending on the problem type (classification, regression,
clustering, etc.), select appropriate algorithms (e.g., decision trees, neural networks,
random forests, SVMs, etc.).
 Model Training: Train the model using historical data, adjusting parameters to optimize
its performance.
 Cross-validation: Use techniques like k-fold cross-validation to evaluate model
performance and ensure it's generalizable to new data.
5. Evaluation and Interpretation
 Performance Metrics: Evaluate models using metrics like accuracy, precision, recall, F1
score (for classification), RMSE, or MAE (for regression) to determine how well they are
performing.
 Model Interpretability: Use techniques such as SHAP values, LIME, or feature
importance to explain how the model is making its predictions. This is especially
important for building trust in the results.
6. Actionable Insights and Decision Support
 Interpret Findings: Translate the model’s output into actionable insights. For example, a
customer churn model might predict which customers are at risk, leading to targeted
retention efforts.
 Make Recommendations: Based on the model’s predictions, provide concrete,
actionable recommendations. This might involve suggesting strategies like product
improvements, marketing campaign adjustments, or operational optimizations.
 Business Context: Relate insights back to the specific business context, ensuring that
they are not just statistically significant but also practical and relevant to stakeholders.
7. Deployment and Monitoring
 Deploy the Model: Integrate the model into the production environment, where it can be
used in real-time or periodically (e.g., for predicting demand or detecting fraud).
 Monitor and Update: Continuously monitor the model's performance over time. As new
data comes in, update the model to ensure that it remains accurate and effective.
 A/B Testing: Run A/B tests to compare different model strategies and decide on the best
course of action.
8. Feedback Loop and Continuous Improvement
 Collect Feedback: Regularly gather feedback from users, business stakeholders, or the
model itself (in the form of new data).
 Refine Models: Based on feedback and evolving data, refine models and features to
improve predictions and relevance.

Introduction to tools for development of data science

software
A data scientist's toolbox is quite diverse, covering a variety of tools for data manipulation,
analysis, and visualization, as well as for deploying machine learning models. Here are the key
tools typically included in a data scientist's arsenal:
1. Programming Languages
Python
Python is one of the most popular programming languages for data science, due to its simplicity,
readability, and the vast array of libraries available.
 Features:
o Interpreted language, high-level syntax.
o Extensive ecosystem with libraries for data analysis, machine learning, data visualization,
etc.
o Supported in various environments such as Jupyter Notebooks, Google Colab, and
integrated development environments (IDEs) like PyCharm and VS Code.
o Object-oriented, functional, and procedural programming support.
 Popular Libraries for Data Science:
o NumPy: Library for numerical computing and handling large multidimensional arrays. It
provides high-performance array objects and tools for integrating C, C++, and Fortran
code.
o Pandas: Offers data structures (DataFrames, Series) for working with structured data,
including support for handling missing data, reshaping, and merging data.
o Matplotlib: A plotting library for creating static, animated, and interactive visualizations
in Python. It can create a wide variety of graphs and charts.
o Seaborn: Built on top of Matplotlib, Seaborn simplifies the creation of complex
statistical visualizations and makes them aesthetically pleasing.
o Scikit-learn: A library for machine learning that includes tools for classification,
regression, clustering, and dimensionality reduction. It also provides tools for model
selection and evaluation.
o TensorFlow/PyTorch: Popular deep learning libraries for building and training neural
networks.
 Use Cases: Data preprocessing, statistical analysis, machine learning, deep learning,
automation, and visualization.
R
R is another powerful language for statistical computing and data analysis, commonly used by
statisticians and researchers.
 Features:
o Great for statistical modeling and exploratory data analysis.
o Rich ecosystem with specific packages for handling various statistical methods.
o Excellent data visualization capabilities.
o Interactive environment with integrated support for analysis, graphing, and reporting.
 Popular Libraries for Data Science:
o ggplot2: A data visualization package based on the Grammar of Graphics, making it easy
to create complex multi-layered visualizations.
o dplyr/tidyr: Core packages for data manipulation and tidying data. dplyr simplifies
common operations like filtering, selecting, and grouping data.
o caret: Provides a unified interface to multiple machine learning algorithms and tools for
pre-processing and model evaluation.
o shiny: Used to create interactive web applications, particularly useful for creating
dashboards and reports.
o randomForest: Implements random forest algorithm for classification and regression
tasks.
 Use Cases: Statistical analysis, data visualization, bioinformatics, machine learning, and
interactive web applications.
SQL (Structured Query Language)
SQL is the standard language for managing and querying relational databases. It is an essential
tool for data scientists who need to retrieve, manipulate, and aggregate large datasets stored in
relational databases.
 Features:
o Supports querying, updating, and managing relational databases.
o Enables complex joins, subqueries, and aggregations.
o Integrates well with other programming languages and data science workflows.
 Common SQL Databases:
o MySQL/PostgreSQL: Open-source relational databases.
o Microsoft SQL Server: Enterprise-level relational database system.
o SQLite: Lightweight, file-based database commonly used for smaller projects.
 Use Cases: Data extraction from relational databases, data transformation, and analysis.

2. Data Cleaning and Transformation Tools

Pandas (Python)
 Key Features:
o Offers DataFrame and Series data structures that handle heterogeneous data (strings, floats,
integers).
o Provides powerful functions for data wrangling like merge(), pivot(), dropna(), and fillna().
o Efficient handling of missing data.
o Tools for merging, reshaping, and grouping data.
 Use Cases: Preprocessing data, removing duplicates, handling missing values, merging datasets,
and reshaping data.
OpenRefine
 Key Features:
o A tool for cleaning messy data, transforming it into structured formats.
o Handles tasks like clustering similar values, splitting data into multiple columns, and
transforming data into different formats.
o Can be used for data reconciliation, linking datasets, and data quality management.
 Use Cases: Data cleaning, deduplication, data transformation.
Alteryx
 Key Features:
o Drag-and-drop interface for users who may not be familiar with coding.
o Robust data transformation, integration, and cleansing tools.
o Built-in support for predictive analytics and machine learning.
o Can connect to various data sources including flat files, databases, and cloud sources.
 Use Cases: Data integration, automation of data workflows, and creating analytics
pipelines.

3. Data Visualization Tools

Tableau
 Key Features:
o Interactive data visualization tool that enables users to create powerful dashboards.
o Drag-and-drop interface for ease of use.
o Real-time data analytics with built-in connectors to multiple data sources (databases,
cloud, etc.).
o Can create charts, maps, and other visualizations that update dynamically based on new
data.
 Use Cases: Business intelligence, interactive dashboards, data visualization.
Power BI
 Key Features:
o A Microsoft tool for creating reports and dashboards.
o Seamless integration with other Microsoft tools like Excel and Azure.
o Data modeling, querying, and visualizations are handled through Power Query and DAX
(Data Analysis Expressions).
o Highly effective for real-time data reporting.
 Use Cases: Business intelligence, reporting, and analytics in a corporate setting.

Matplotlib & Seaborn (Python)

 Matplotlib:
o Features: Offers a variety of 2D plotting options, including bar charts, line plots, scatter
plots, histograms, etc.
o Use Case: Visualizing data distributions, time series data, and comparisons.
 Seaborn:
o Features: Built on top of Matplotlib, Seaborn simplifies complex visualizations, like
violin plots, pair plots, and heatmaps, while maintaining aesthetics.
o Use Case: Statistical data visualization (correlation heatmaps, box plots, etc.).

4. Machine Learning Tools

Scikit-learn (Python)
 Key Features:
o Implements a variety of machine learning algorithms for classification, regression,
clustering, and dimensionality reduction.
o Built on top of NumPy, SciPy, and Matplotlib.
o Supports cross-validation, hyperparameter tuning, and model evaluation.
 Use Cases: Building machine learning models, evaluating models, model selection, and
deployment.

TensorFlow & Keras (Python)

 TensorFlow:
o Key Features: Open-source deep learning framework for building scalable, distributed
neural network models.
o Use Case: Deep learning tasks like image recognition, natural language processing
(NLP), and recommendation systems.
 Keras:
o Key Features: High-level neural networks API, which simplifies building deep learning
models using TensorFlow as the backend.
o Use Case: Quick prototyping of deep learning models with minimal effort.
PyTorch
 Key Features:
o A deep learning framework that provides flexibility for research and production.
o Dynamic computation graph (eager execution) which allows for more flexibility during
training and debugging.
 Use Case: Research-heavy applications, computer vision, and NLP.

5. Big Data Tools

Apache Hadoop
 Key Features:
o A framework for distributed storage and processing of large datasets.
o Breaks down data into smaller chunks, processes them in parallel across multiple nodes
in a cluster.
o Key components include HDFS (Hadoop Distributed File System) and MapReduce for
parallel computation.
 Use Case: Handling big data, distributed storage and computation, batch processing.
Apache Spark
 Key Features:
o In-memory, distributed computing system for processing large-scale data.
o More efficient than Hadoop for certain use cases because it operates in memory rather
than reading and writing to disk.
o Supports batch and real-time streaming data.
 Use Case: Real-time data processing, large-scale data analytics, machine learning on big
data.

6. Cloud Platforms

AWS (Amazon Web Services)

 Key Features:
o Provides a comprehensive set of tools for data storage (S3), computing (EC2), machine
learning (SageMaker), and data analytics (Redshift, Athena).
o Scalability and flexibility with pay-as-you-go pricing.
 Use Case: Data storage, big data processing, machine learning, and model deployment.
Google Cloud Platform (GCP)
 Key Features:
o Offers services like BigQuery (for data warehousing and SQL queries), AI Platform (for
machine learning), and Google Kubernetes Engine (for container orchestration).
o Seamless integration with Google’s data science and machine learning products.
 Use Case: Big data analytics, machine learning, cloud-based computing.

7. Collaboration & Version Control Tools

Git
 Key Features:
o A distributed version control system for tracking changes to code.
o Supports branching, merging, and version tracking to facilitate collaboration between
teams.
 Use Case: Code collaboration, version tracking, and managing machine learning model
pipelines.
GitHub / GitLab
 Key Features:
o Git repository hosting platforms with features for continuous integration, code review,
and issue tracking.
 Use Case: Code collaboration, version control, and project management.

Markdown

In data science, Markdown is commonly used for documenting code, processes, and results in a
clear and organized way.

1. Jupyter Notebooks

 Use Case: Jupyter Notebooks allow you to mix code, results, and Markdown in one
interactive document.
 Markdown Features: You can use Markdown cells to write explanations,
documentation, and include LaTeX formulas.
 Key Benefits: This tool supports interactive code execution alongside documentation,
making it great for exploratory data analysis and storytelling with data.

2. R Markdown (RStudio)

 Use Case: R Markdown integrates code (R, Python, etc.) with narrative text and outputs
to various formats like HTML, PDF, or Word.
 Markdown Features: You can include code chunks, text, equations (via LaTeX), and
images all in one document.
 Key Benefits: R Markdown supports dynamic report generation and is widely used for
creating data analysis reports and presentations.
3. Markdown Preview Enhanced (VS Code Extension)

 Use Case: A plugin for Visual Studio Code that enhances the Markdown editing
experience.
 Markdown Features: It supports previewing Markdown in real-time, rendering LaTeX
math equations, and includes custom styles for enhanced viewing.
 Key Benefits: It's great for writing documentation with rich formatting options.

4. GitHub & GitLab

 Use Case: GitHub and GitLab both support Markdown rendering for project README
files, wikis, and documentation.
 Markdown Features: Supports code snippets, tables, images, links, and LaTeX math.
 Key Benefits: These platforms are great for collaboration, and their built-in Markdown
support is ideal for sharing and managing data science projects.

Knowledge Graphs Pov
No ratings yet
Knowledge Graphs Pov
18 pages
12 Comp Sci 1 Revision Notes Pythan Advanced Prog
No ratings yet
12 Comp Sci 1 Revision Notes Pythan Advanced Prog
5 pages
Data Science
No ratings yet
Data Science
10 pages
Impact of Data Science Across Industries
No ratings yet
Impact of Data Science Across Industries
3 pages
The Field of Data Science
No ratings yet
The Field of Data Science
4 pages
Data Science Course in Hyderabad
No ratings yet
Data Science Course in Hyderabad
9 pages
Introduction To Data Science
No ratings yet
Introduction To Data Science
24 pages
Data Science Management_vss
No ratings yet
Data Science Management_vss
84 pages
Introduction To Data Science and Python For Data
No ratings yet
Introduction To Data Science and Python For Data
12 pages
Fundamentals of Data Science unit 1
No ratings yet
Fundamentals of Data Science unit 1
33 pages
Fd45092a Ccad 459e Bc18 b01536fd6bac Untitled
No ratings yet
Fd45092a Ccad 459e Bc18 b01536fd6bac Untitled
53 pages
Data Science & Cyber Security
No ratings yet
Data Science & Cyber Security
13 pages
DS QB unit 1
No ratings yet
DS QB unit 1
45 pages
Unit I
No ratings yet
Unit I
13 pages
Selected Topics - Datascience
No ratings yet
Selected Topics - Datascience
17 pages
Data Sceince 2
No ratings yet
Data Sceince 2
14 pages
Data SC Details
No ratings yet
Data SC Details
3 pages
Unit I
No ratings yet
Unit I
52 pages
Data-Science-and-Analytics-Reviewer
No ratings yet
Data-Science-and-Analytics-Reviewer
5 pages
Extended_Comprehensive_Guide_to_Data_Science
No ratings yet
Extended_Comprehensive_Guide_to_Data_Science
2 pages
5th Sem Internship Eport
No ratings yet
5th Sem Internship Eport
83 pages
Data Science Modern Technology5
No ratings yet
Data Science Modern Technology5
6 pages
Final Industrial Report
No ratings yet
Final Industrial Report
34 pages
Technical Report Writing For Ca2 Examination: Topic: Introduction To Data Science
No ratings yet
Technical Report Writing For Ca2 Examination: Topic: Introduction To Data Science
7 pages
Unit 1
No ratings yet
Unit 1
21 pages
Data Science Unit 1
No ratings yet
Data Science Unit 1
85 pages
File
No ratings yet
File
27 pages
Introduction To Data Science
No ratings yet
Introduction To Data Science
11 pages
Data Science
No ratings yet
Data Science
18 pages
DS_UNIT I
No ratings yet
DS_UNIT I
3 pages
Internship Report: T.J.Instituteoftechnology
No ratings yet
Internship Report: T.J.Instituteoftechnology
29 pages
IDS Unit 1
No ratings yet
IDS Unit 1
67 pages
A Functional Approach To Basics of Data Science With Excel-Book - Chapter 1 and 2 - 1st Print
No ratings yet
A Functional Approach To Basics of Data Science With Excel-Book - Chapter 1 and 2 - 1st Print
13 pages
Unit 2 Data Science
No ratings yet
Unit 2 Data Science
53 pages
21 Powerful Tips Tricks and Hacks for Data Scientists
No ratings yet
21 Powerful Tips Tricks and Hacks for Data Scientists
38 pages
Unit 1-FDS
No ratings yet
Unit 1-FDS
18 pages
Overview of Data Science
No ratings yet
Overview of Data Science
3 pages
Notes Data Science
No ratings yet
Notes Data Science
5 pages
ds sem
No ratings yet
ds sem
71 pages
Essential Data Science Notes - A Concise PDF Guide
No ratings yet
Essential Data Science Notes - A Concise PDF Guide
20 pages
Data Science
No ratings yet
Data Science
11 pages
6001_DATASCIENCE WITH BIGDATA
No ratings yet
6001_DATASCIENCE WITH BIGDATA
34 pages
Unit - 1
No ratings yet
Unit - 1
25 pages
Data Science Using Python
No ratings yet
Data Science Using Python
85 pages
Handbook Introduction of Data Science AY 23-24
No ratings yet
Handbook Introduction of Data Science AY 23-24
171 pages
Lecture 1 Introduction Tools An - Chniques For Data Science
No ratings yet
Lecture 1 Introduction Tools An - Chniques For Data Science
16 pages
Data Science QB Solve SEM6
No ratings yet
Data Science QB Solve SEM6
157 pages
Data Science
No ratings yet
Data Science
2 pages
Data Science in IOT
No ratings yet
Data Science in IOT
220 pages
Unit 3
No ratings yet
Unit 3
9 pages
Data Science
No ratings yet
Data Science
18 pages
himadev
No ratings yet
himadev
37 pages
DataScienceUnlocked
No ratings yet
DataScienceUnlocked
35 pages
Ids Unit I
No ratings yet
Ids Unit I
46 pages
What Is Data Science
No ratings yet
What Is Data Science
14 pages
DA-1,2,3[1]_merged
No ratings yet
DA-1,2,3[1]_merged
39 pages
Data Science Notes Structured FINAL v2
No ratings yet
Data Science Notes Structured FINAL v2
9 pages
DATA SCIENCE LIFE CYCLE
No ratings yet
DATA SCIENCE LIFE CYCLE
12 pages
Data Science PDF
No ratings yet
Data Science PDF
11 pages
"Big Data Science" Basic Concepts and Applications
From Everand
"Big Data Science" Basic Concepts and Applications
Sukanta Bhattacharya
No ratings yet
Data Science Mastery: From Beginner to Expert in Big Data Analytics
From Everand
Data Science Mastery: From Beginner to Expert in Big Data Analytics
Kameron Hussain
No ratings yet
DATA ANALYSIS AND DATA SCIENCE: Unlock Insights and Drive Innovation with Advanced Analytical Techniques (2024 Guide)
From Everand
DATA ANALYSIS AND DATA SCIENCE: Unlock Insights and Drive Innovation with Advanced Analytical Techniques (2024 Guide)
WINTON CLEM
No ratings yet
Measures of Central Tendency
No ratings yet
Measures of Central Tendency
22 pages
Taxi Booking Application: Mustafa Khuzembhai Alirajpurwala (21MCA058)
No ratings yet
Taxi Booking Application: Mustafa Khuzembhai Alirajpurwala (21MCA058)
30 pages
G238p
No ratings yet
G238p
43 pages
Attendance Management System Using RFID: Chapter One
No ratings yet
Attendance Management System Using RFID: Chapter One
3 pages
Practical File CS 2025
No ratings yet
Practical File CS 2025
2 pages
100 Interview Questions Power Bi PDF
No ratings yet
100 Interview Questions Power Bi PDF
33 pages
Transaction Processing System
No ratings yet
Transaction Processing System
4 pages
SQL Function Types
No ratings yet
SQL Function Types
61 pages
Database Management System Class 10 IT 402 Question
No ratings yet
Database Management System Class 10 IT 402 Question
8 pages
Entry Level Database Developer Resume
100% (2)
Entry Level Database Developer Resume
7 pages
Building Advanced AI Agent Systems: From Fundamentals to Scalable Architecture
No ratings yet
Building Advanced AI Agent Systems: From Fundamentals to Scalable Architecture
18 pages
Exam 000-552: Ibm Infosphere Optim For Distributed Systems - V7.3.1
No ratings yet
Exam 000-552: Ibm Infosphere Optim For Distributed Systems - V7.3.1
70 pages
Symbiosis Centre For Information Technology: MBA-DSDA 2020-22 (Semester I) Research Methodology
No ratings yet
Symbiosis Centre For Information Technology: MBA-DSDA 2020-22 (Semester I) Research Methodology
4 pages
Test Bank of IT . With Answers (1)
No ratings yet
Test Bank of IT . With Answers (1)
13 pages
Unique Student Identity and Profile System
No ratings yet
Unique Student Identity and Profile System
51 pages
Quiz
No ratings yet
Quiz
3 pages
Dell Avamar For SQL Server 19.9
No ratings yet
Dell Avamar For SQL Server 19.9
149 pages
BDA-24_Lect (3-4)-(Fundamentals of Data Analysis)
No ratings yet
BDA-24_Lect (3-4)-(Fundamentals of Data Analysis)
15 pages
Expensetrackermanagementsystemprojectreport.docx
No ratings yet
Expensetrackermanagementsystemprojectreport.docx
120 pages
MohitCV
No ratings yet
MohitCV
3 pages
Dag 205 Quantitative Analysis
No ratings yet
Dag 205 Quantitative Analysis
4 pages
Applied Statistics Ans Key
No ratings yet
Applied Statistics Ans Key
3 pages
Week 4 - 5 - Data Preprocessing
No ratings yet
Week 4 - 5 - Data Preprocessing
67 pages
Download ebooks file English Suffixes Stress Assignment Properties Productivity Selection and Combinatorial Processes 1st Edition Ives Trevian all chapters
100% (3)
Download ebooks file English Suffixes Stress Assignment Properties Productivity Selection and Combinatorial Processes 1st Edition Ives Trevian all chapters
81 pages
Internship
100% (1)
Internship
18 pages
(CSE3083) Lab Practical Assignment #8
No ratings yet
(CSE3083) Lab Practical Assignment #8
6 pages
Information Management: Prof. Sara Foresti, Prof. Giovanni Livraga
No ratings yet
Information Management: Prof. Sara Foresti, Prof. Giovanni Livraga
11 pages
Ilide - Info Employee Management System Srs PR
No ratings yet
Ilide - Info Employee Management System Srs PR
17 pages

datascience

Uploaded by

datascience

Uploaded by

UNIT 1

Importance of data Science

Data scientist’s tool box:

Introduction to tools for development of data science

2. Data Cleaning and Transformation Tools

3. Data Visualization Tools

Matplotlib & Seaborn (Python)

4. Machine Learning Tools

TensorFlow & Keras (Python)

5. Big Data Tools

AWS (Amazon Web Services)

7. Collaboration & Version Control Tools

4. GitHub & GitLab

You might also like