0% found this document useful (0 votes)

43 views

Google - Colab Pyspark - Ml.classification Pyspark - Context Pyspark - Sql.session

This document summarizes a logistic regression model trained on sample LIBSVM data using PySpark. It loads the training data, trains a logistic regression model with hyperparameters, and prints the coefficients and intercept. It then trains a multinomial logistic regression model and prints the coefficient matrix and intercept vector.

Uploaded by

Darpan Sarode

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

43 views

Google - Colab Pyspark - Ml.classification Pyspark - Context Pyspark - Sql.session

Uploaded by

Darpan Sarode

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

Spark Assignment 2 M1084147

[9]: from google.colab import drive

[6]: from pyspark.ml.classification import LogisticRegression

[7]: from pyspark.context import SparkContext

from pyspark.sql.session import SparkSession

[8]: sc = SparkContext('local')
spark = SparkSession(sc)

[11]: training = spark.read.format("libsvm").

,→load("sample_libsvm_data.txt")

[12]: lr = LogisticRegression(maxIter=10, regParam=0.3,␣

,→elasticNetParam=0.8)

[13]: lrModel = lr.fit(training)

[18]: lrModel.coefficients

[18]: SparseVector(692, {272: -0.0001, 300: -0.0001, 323: 0.0, 350:␣

,→0.0004, 351:

0.0003, 378: 0.0006, 379: 0.0004, 405: 0.0004, 406: 0.0008,␣

,→407: 0.0005, 428:

-0.0, 433: 0.0006, 434: 0.0009, 435: 0.0001, 455: -0.0, 456:␣
,→-0.0, 461: 0.0005,

462: 0.0008, 483: -0.0001, 484: -0.0, 489: 0.0005, 490: 0.

,→0005, 496: -0.0, 511:

-0.0003, 512: -0.0001, 517: 0.0005, 539: -0.0001, 540: -0.

,→0004, 568: -0.0001})

[14]: print("Coefficients: " + str(lrModel.coefficients))

print("Intercept: " + str(lrModel.intercept))
Coefficients:␣
,→(692,[272,300,323,350,351,378,379,405,406,407,428,433,434,435,455,

1
456,461,462,483,484,489,490,496,511,512,517,539,540,568],[-7.
,→52068987138421e-05,

-8.115773146847101e-05,3.814692771846369e-05,0.
,→0003776490540424337,0.00034051483

661944103,0.0005514455157343105,0.0004085386116096913,0.
,→000419746733274946,0.000

8119171358670028,0.0005027708372668751,-2.
,→3929260406601844e-05,0.000574504802090

229,0.0009037546426803721,7.818229700244018e-05,-2.
,→1787551952912764e-05,-3.40216

58217896256e-05,0.0004966517360637634,0.0008190557828370367,-8.
,→017982139522704e-

05,-2.7431694037836214e-05,0.0004810832226238988,0.
,→00048408017626778765,-8.92647

2920011488e-06,-0.00034148812330427335,-8.950592574121486e-05,0.
,→0004864546911689

2167,-8.478698005186209e-05,-0.0004234783215831763,-7.
,→29653577763134e-05])

Intercept: -0.5991460286401435
[15]: mlr = LogisticRegression(maxIter=10, regParam=0.3,␣
,→elasticNetParam=0.8, family="multinomial")

[16]: mlrModel = mlr.fit(training)

[17]: print("Multinomial coefficients: " + str(mlrModel.

,→coefficientMatrix))

print("Multinomial intercepts: " + str(mlrModel.

,→interceptVector))

Multinomial coefficients: 2 X 692 CSRMatrix

(0,272) 0.0001
(0,300) 0.0001
(0,350) -0.0002
(0,351) -0.0001
(0,378) -0.0003
(0,379) -0.0002

2
(0,405) -0.0002
(0,406) -0.0004
(0,407) -0.0002
(0,433) -0.0003
(0,434) -0.0005
(0,435) -0.0001
(0,456) 0.0
(0,461) -0.0002
(0,462) -0.0004
(0,483) 0.0001
..
..
Multinomial intercepts: [0.2750587585718093,-0.2750587585718093]
[ ]:

1.9 JTD Timing
100% (1)
1.9 JTD Timing
12 pages
Weld Toe Burr Grinding Procedure
No ratings yet
Weld Toe Burr Grinding Procedure
3 pages
Math Reproducibles - Grade 6
From Everand
Math Reproducibles - Grade 6
Vicky Shiotsu
5/5 (4)
Regression Model Usign Pyspark
No ratings yet
Regression Model Usign Pyspark
4 pages
Submission_template_513_E_div
No ratings yet
Submission_template_513_E_div
53 pages
Logistic _Regresssion
No ratings yet
Logistic _Regresssion
22 pages
Ex7 HTML
No ratings yet
Ex7 HTML
3 pages
DA_012307
No ratings yet
DA_012307
8 pages
TP.ipynb - Colab
No ratings yet
TP.ipynb - Colab
6 pages
7 Ass
No ratings yet
7 Ass
4 pages
Import As Import As Import As: "Default - CSV"
No ratings yet
Import As Import As Import As: "Default - CSV"
9 pages
ml_all_projectpdf_removed
No ratings yet
ml_all_projectpdf_removed
41 pages
50 Startup
No ratings yet
50 Startup
2 pages
Supervised_classi_&_regression
No ratings yet
Supervised_classi_&_regression
5 pages
Week 6
No ratings yet
Week 6
4 pages
ML-journal
No ratings yet
ML-journal
45 pages
Assignment - Jupyter Notebook
No ratings yet
Assignment - Jupyter Notebook
10 pages
OLSLinear Regquestion
No ratings yet
OLSLinear Regquestion
5 pages
Classification Review
No ratings yet
Classification Review
8 pages
Practical 9
No ratings yet
Practical 9
3 pages
Assignment II Machine Learning
No ratings yet
Assignment II Machine Learning
8 pages
Regression Prac 9
No ratings yet
Regression Prac 9
8 pages
ML Assignment 4
No ratings yet
ML Assignment 4
7 pages
DA_Programs
No ratings yet
DA_Programs
44 pages
School of Engineering: Lab Manual On Machine Learning Lab
No ratings yet
School of Engineering: Lab Manual On Machine Learning Lab
23 pages
Pyspark - Mllib Package
No ratings yet
Pyspark - Mllib Package
87 pages
Naive Bayes
No ratings yet
Naive Bayes
58 pages
Machine Learning Practicals
No ratings yet
Machine Learning Practicals
7 pages
vertopal.com_MLEE_LAB1
No ratings yet
vertopal.com_MLEE_LAB1
9 pages
Dsbda Viva Ans
No ratings yet
Dsbda Viva Ans
8 pages
Data Mining Practicals
No ratings yet
Data Mining Practicals
22 pages
221421601049 - MLA Lab Record [2024]
No ratings yet
221421601049 - MLA Lab Record [2024]
47 pages
16BCB0126 VL2018195002535 Pe003
No ratings yet
16BCB0126 VL2018195002535 Pe003
40 pages
Import Library Python
No ratings yet
Import Library Python
10 pages
ML File
No ratings yet
ML File
10 pages
Regression Analysis
No ratings yet
Regression Analysis
6 pages
Credit Card 1679991215
No ratings yet
Credit Card 1679991215
26 pages
Machine Learning Model Building
No ratings yet
Machine Learning Model Building
6 pages
Pract5 1
No ratings yet
Pract5 1
3 pages
ML P-6 - 024
No ratings yet
ML P-6 - 024
22 pages
Big Data Merged
No ratings yet
Big Data Merged
7 pages
HIV Regression Source Code
No ratings yet
HIV Regression Source Code
26 pages
sahil_ml
No ratings yet
sahil_ml
21 pages
Supervised Learning For Data Science...
No ratings yet
Supervised Learning For Data Science...
14 pages
ML Interview Questions
No ratings yet
ML Interview Questions
10 pages
predictive modelling outputs
No ratings yet
predictive modelling outputs
7 pages
Zerox Ready
No ratings yet
Zerox Ready
21 pages
predict student exam result
No ratings yet
predict student exam result
1 page
Slip
No ratings yet
Slip
5 pages
Stock Prediction Web App - Jupyter Notebook
No ratings yet
Stock Prediction Web App - Jupyter Notebook
12 pages
ML Activity Kalyan
No ratings yet
ML Activity Kalyan
21 pages
100 Days of DEep Learning
No ratings yet
100 Days of DEep Learning
5 pages
ML Lab Manual
No ratings yet
ML Lab Manual
12 pages
B-56 Sanket Jambhulkar MLA-1
No ratings yet
B-56 Sanket Jambhulkar MLA-1
10 pages
Machine Learnin
100% (2)
Machine Learnin
23 pages
vertopal.com_Untitled57
No ratings yet
vertopal.com_Untitled57
4 pages
Subset Selection Class Assignment
No ratings yet
Subset Selection Class Assignment
5 pages
21CSC305P Ml - Lab Programs 1 -9
No ratings yet
21CSC305P Ml - Lab Programs 1 -9
36 pages
Lab4 - Jupyter Notebook
No ratings yet
Lab4 - Jupyter Notebook
7 pages
Ml Lab Manual
No ratings yet
Ml Lab Manual
36 pages
Wa0002.
No ratings yet
Wa0002.
5 pages
01 Machine Learning
No ratings yet
01 Machine Learning
25 pages
Kone Ecospace Brochure 2011
No ratings yet
Kone Ecospace Brochure 2011
8 pages
Acti9 iPF K - A9L15692
No ratings yet
Acti9 iPF K - A9L15692
3 pages
How To Read Sheet Music
100% (3)
How To Read Sheet Music
9 pages
Design For: Who Casts The Biggest Shadow ?
No ratings yet
Design For: Who Casts The Biggest Shadow ?
6 pages
Main Final Document To Be Printed
No ratings yet
Main Final Document To Be Printed
56 pages
Acid fast staining SOP
0% (1)
Acid fast staining SOP
3 pages
2-11 Process Constraint Identification (ABBE-R031104)
No ratings yet
2-11 Process Constraint Identification (ABBE-R031104)
37 pages
Far Western University Faculty of Engineering: Specific Objectives Unit I: Elasticity
No ratings yet
Far Western University Faculty of Engineering: Specific Objectives Unit I: Elasticity
5 pages
Process Optimization - 01
No ratings yet
Process Optimization - 01
16 pages
Analyzer A30
No ratings yet
Analyzer A30
1 page
Growing Avocados: Flowering, Pollination and Fruit SET
No ratings yet
Growing Avocados: Flowering, Pollination and Fruit SET
6 pages
Artemis Alexiadou Non-Canonical Passives
No ratings yet
Artemis Alexiadou Non-Canonical Passives
9 pages
Wastewater Treatment Lecture Material
100% (4)
Wastewater Treatment Lecture Material
203 pages
9780199496662
No ratings yet
9780199496662
48 pages
Copia de Inelastic Spectrum-Based Approach For Seismic Design Spectra
No ratings yet
Copia de Inelastic Spectrum-Based Approach For Seismic Design Spectra
9 pages
Documentation and Users Manual: Steve Chapra and Greg Pelletier
No ratings yet
Documentation and Users Manual: Steve Chapra and Greg Pelletier
121 pages
Irjet V11i233
No ratings yet
Irjet V11i233
4 pages
Spare Parts For Burner
No ratings yet
Spare Parts For Burner
8 pages
CE600E - V2.2-Duplex Continues Rectification
No ratings yet
CE600E - V2.2-Duplex Continues Rectification
132 pages
Iso 3087 2020
No ratings yet
Iso 3087 2020
13 pages
Java Unit 3 Notes
No ratings yet
Java Unit 3 Notes
32 pages
Q. When frequency ratio (ω/ωn) is greater than unity, phase angle decreases as - - - - - - A B C D Ans
No ratings yet
Q. When frequency ratio (ω/ωn) is greater than unity, phase angle decreases as - - - - - - A B C D Ans
11 pages
Extending Embedded System Into PL: Zynq Vivado 2016.4 Version
No ratings yet
Extending Embedded System Into PL: Zynq Vivado 2016.4 Version
15 pages
PLC Laboratory - Experiment 8 - PLC Programming Concepts - Program Control Operations
No ratings yet
PLC Laboratory - Experiment 8 - PLC Programming Concepts - Program Control Operations
10 pages
222 Chapter 1
No ratings yet
222 Chapter 1
22 pages
Bion
No ratings yet
Bion
14 pages
Buffer Capacity
100% (1)
Buffer Capacity
40 pages
X.509 Version 3 Certificate: Validity Period
No ratings yet
X.509 Version 3 Certificate: Validity Period
5 pages

Google - Colab Pyspark - Ml.classification Pyspark - Context Pyspark - Sql.session

Uploaded by

Google - Colab Pyspark - Ml.classification Pyspark - Context Pyspark - Sql.session

Uploaded by

Spark Assignment 2 M1084147

[9]: from google.colab import drive

[6]: from pyspark.ml.classification import LogisticRegression

[7]: from pyspark.context import SparkContext

[11]: training = spark.read.format("libsvm").

[12]: lr = LogisticRegression(maxIter=10, regParam=0.3,␣

[13]: lrModel = lr.fit(training)

[18]: SparseVector(692, {272: -0.0001, 300: -0.0001, 323: 0.0, 350:␣

0.0003, 378: 0.0006, 379: 0.0004, 405: 0.0004, 406: 0.0008,␣

462: 0.0008, 483: -0.0001, 484: -0.0, 489: 0.0005, 490: 0.

-0.0003, 512: -0.0001, 517: 0.0005, 539: -0.0001, 540: -0.

[14]: print("Coefficients: " + str(lrModel.coefficients))

[16]: mlrModel = mlr.fit(training)

[17]: print("Multinomial coefficients: " + str(mlrModel.

print("Multinomial intercepts: " + str(mlrModel.

Multinomial coefficients: 2 X 692 CSRMatrix

You might also like