0% found this document useful (0 votes)

53 views7 pages

Linear Regression

This document discusses simple linear regression using a dataset on advertising. It splits the TV advertising data into training and test sets, trains a linear regression model on the training set, uses the model to make predictions on the test set, and analyzes the results, finding a linear relationship between TV advertising and sales.

Uploaded by

Mimansha Sharma

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

53 views7 pages

Linear Regression

Uploaded by

Mimansha Sharma

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 7

2/28/22, 3:10 PM Linear regression

NAME:- PRIADARSHANA
ROLL NO:- 2019332

SIMPLE LINEAR REGRESSION

localhost:8888/notebooks/Machine learning/Linear regression.ipynb 1/7

2/28/22, 3:10 PM Linear regression

In [1]: import pandas as pd

import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score
import statsmodels.api as sm

data = pd.read_csv(r"Advertising.csv")
data

Out[1]:
Unnamed: 0 TV Radio Newspaper Sales

0 1 230.1 37.8 69.2 22.1

1 2 44.5 39.3 45.1 10.4

2 3 17.2 45.9 69.3 9.3

3 4 151.5 41.3 58.5 18.5

4 5 180.8 10.8 58.4 12.9

5 6 8.7 48.9 75.0 7.2

6 7 57.5 32.8 23.5 11.8

7 8 120.2 19.6 11.6 13.2

8 9 8.6 2.1 1.0 4.8

9 10 199.8 2.6 21.2 10.6

10 11 66.1 5.8 24.2 8.6

11 12 214.7 24.0 4.0 17.4

12 13 23.8 35.1 65.9 9.2

13 14 97.5 7.6 7.2 9.7

14 15 204.1 32.9 46.0 19.0

15 16 195.4 47.7 52.9 22.4

16 17 67.8 36.6 114.0 12.5

17 18 281.4 39.6 55.8 24.4

18 19 69.2 20.5 18.3 11.3

19 20 147.3 23.9 19.1 14.6

20 21 218.4 27.7 53.4 18.0

21 22 237.4 5.1 23.5 12.5

22 23 13.2 15.9 49.6 5.6

23 24 228.3 16.9 26.2 15.5

24 25 62.3 12.6 18.3 9.7

25 26 262.9 3.5 19.5 12.0

26 27 142.9 29.3 12.6 15.0

27 28 240.1 16.7 22.9 15.9

28 29 248.8 27.1 22.9 18.9

localhost:8888/notebooks/Machine learning/Linear regression.ipynb 2/7

2/28/22, 3:10 PM Linear regression

Unnamed: 0 TV Radio Newspaper Sales

29 30 70.6 16.0 40.8 10.5

... ... ... ... ... ...

170 171 50.0 11.6 18.4 8.4

171 172 164.5 20.9 47.4 14.5

172 173 19.6 20.1 17.0 7.6

173 174 168.4 7.1 12.8 11.7

174 175 222.4 3.4 13.1 11.5

175 176 276.9 48.9 41.8 27.0

176 177 248.4 30.2 20.3 20.2

177 178 170.2 7.8 35.2 11.7

178 179 276.7 2.3 23.7 11.8

179 180 165.6 10.0 17.6 12.6

180 181 156.6 2.6 8.3 10.5

181 182 218.5 5.4 27.4 12.2

182 183 56.2 5.7 29.7 8.7

183 184 287.6 43.0 71.8 26.2

184 185 253.8 21.3 30.0 17.6

185 186 205.0 45.1 19.6 22.6

186 187 139.5 2.1 26.6 10.3

187 188 191.1 28.7 18.2 17.3

188 189 286.0 13.9 3.7 15.9

189 190 18.7 12.1 23.4 6.7

190 191 39.5 41.1 5.8 10.8

191 192 75.5 10.8 6.0 9.9

192 193 17.2 4.1 31.6 5.9

193 194 166.8 42.0 3.6 19.6

194 195 149.7 35.6 6.0 17.3

195 196 38.2 3.7 13.8 7.6

196 197 94.2 4.9 8.1 9.7

197 198 177.0 9.3 6.4 12.8

198 199 283.6 42.0 66.2 25.5

199 200 232.1 8.6 8.7 13.4

200 rows × 5 columns

In [2]: data.columns

Out[2]: Index(['Unnamed: 0', 'TV', 'Radio', 'Newspaper', 'Sales'], dtype='object')

localhost:8888/notebooks/Machine learning/Linear regression.ipynb 3/7

2/28/22, 3:10 PM Linear regression

In [4]: plt.figure(figsize=(16, 8))

plt.scatter(
data['TV'],
data['Sales']
)
plt.xlabel("TV ")
plt.ylabel("Sales ")
plt.show()

In [6]: X = data['TV'].values.reshape(-1,1)
y = data['Sales'].values.reshape(-1,1)

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.3,random_stat

print(X_train.shape)
print(X_test.shape)
print(y_train.shape)
print(y_test.shape)
reg = LinearRegression()
reg.fit(X_train, y_train)

(140, 1)

(60, 1)

(140, 1)

(60, 1)

Out[6]: LinearRegression(copy_X=True, fit_intercept=True, n_jobs=None,

normalize=False)

localhost:8888/notebooks/Machine learning/Linear regression.ipynb 4/7

2/28/22, 3:10 PM Linear regression

In [7]: print(reg.coef_[0][0])
print(reg.intercept_[0])

print("The linear model is: Y = {:.5} + {:.5}X".format(reg.intercept_[0], reg.coe

0.04581434217189623

7.310810165411681

The linear model is: Y = 7.3108 + 0.045814X

In [9]: predictions = reg.predict(X_test)

plt.figure(figsize=(16, 8))
plt.scatter(
data['TV'],
data['Sales']
)
plt.plot(
X_test,
predictions,
linewidth=2,
color='red'
)
plt.xlabel("TV ")
plt.ylabel("Sales ")
plt.show()

localhost:8888/notebooks/Machine learning/Linear regression.ipynb 5/7

2/28/22, 3:10 PM Linear regression

In [10]: X=X_train
y=y_train
X2 = sm.add_constant(X)
est = sm.OLS(y, X2)
est2 = est.fit()
print(est2.summary())

OLS Regression Results

==============================================================================

Dep. Variable: y R-squared: 0.555

Model: OLS Adj. R-squared: 0.552

Method: Least Squares F-statistic: 172.3

Date: Mon, 28 Feb 2022 Prob (F-statistic): 4.76e-26

Time: 14:28:59 Log-Likelihood: -371.64

No. Observations: 140 AIC: 747.3

Df Residuals: 138 BIC: 753.2

Df Model: 1

Covariance Type: nonrobust

==============================================================================

coef std err t P>|t| [0.025 0.975]

------------------------------------------------------------------------------

const 7.3108 0.611 11.957 0.000 6.102 8.520

x1 0.0458 0.003 13.125 0.000 0.039 0.053

==============================================================================

Omnibus: 1.727 Durbin-Watson: 1.908

Prob(Omnibus): 0.422 Jarque-Bera (JB): 1.452

Skew: -0.086 Prob(JB): 0.484

Kurtosis: 2.532 Cond. No. 366.

==============================================================================

Warnings:

[1] Standard Errors assume that the covariance matrix of the errors is correctl
y specified.

In [11]: print('Train Score :', reg.score(X_train,y_train))

print('Test Score:', reg.score(X_test,y_test))

Train Score : 0.5552336104251212

Test Score: 0.725606346597073

In [12]: from sklearn import metrics

print('MSE :', metrics.mean_squared_error(y_test,predictions))

print('RMSE :', np.sqrt(metrics.mean_squared_error(y_test,predictions)))

MSE : 7.497479593464674

RMSE : 2.7381525876883988

MULTIPLE LINEAR REGRESSION

localhost:8888/notebooks/Machine learning/Linear regression.ipynb 6/7

2/28/22, 3:10 PM Linear regression

In [14]: Xs = data.drop(['Sales', 'Unnamed: 0'], axis=1)

y = data['Sales'].values.reshape(-1,1)
reg = LinearRegression()
reg.fit(Xs, y)
print("The linear model is: Y = {:.5} + {:.5}*TV + {:.5}*radio + {:.5}*newspaper

The linear model is: Y = 2.9389 + 0.045765TV + 0.18853radio + -0.0010375*news

paper

In [16]: X = np.column_stack((data['TV'], data['Radio'], data['Newspaper']))

y = data['Sales']
X2 = sm.add_constant(X)
est = sm.OLS(y, X2)
est2 = est.fit()
print(est2.summary())

OLS Regression Results

==============================================================================

Dep. Variable: Sales R-squared: 0.897

Model: OLS Adj. R-squared: 0.896

Method: Least Squares F-statistic: 570.3

Date: Mon, 28 Feb 2022 Prob (F-statistic): 1.58e-96

Time: 15:01:01 Log-Likelihood: -386.18

No. Observations: 200 AIC: 780.4

Df Residuals: 196 BIC: 793.6

Df Model: 3

Covariance Type: nonrobust

==============================================================================

coef std err t P>|t| [0.025 0.975]

------------------------------------------------------------------------------

const 2.9389 0.312 9.422 0.000 2.324 3.554

x1 0.0458 0.001 32.809 0.000 0.043 0.049

x2 0.1885 0.009 21.893 0.000 0.172 0.206

x3 -0.0010 0.006 -0.177 0.860 -0.013 0.011

==============================================================================

Omnibus: 60.414 Durbin-Watson: 2.084

Prob(Omnibus): 0.000 Jarque-Bera (JB): 151.241

Skew: -1.327 Prob(JB): 1.44e-33

Kurtosis: 6.332 Cond. No. 454.

==============================================================================

Warnings:

[1] Standard Errors assume that the covariance matrix of the errors is correctl
y specified.

localhost:8888/notebooks/Machine learning/Linear regression.ipynb 7/7

Simple and Multiple Regression
No ratings yet
Simple and Multiple Regression
9 pages
SAT and GPA Regression Analysis
100% (1)
SAT and GPA Regression Analysis
1 page
OLS Regression Analysis on INTRATE
No ratings yet
OLS Regression Analysis on INTRATE
8 pages
Pregunta 5
No ratings yet
Pregunta 5
2 pages
Assignment 1 Tuneer
No ratings yet
Assignment 1 Tuneer
5 pages
Assignment 2
No ratings yet
Assignment 2
5 pages
Linear Regression - Ipynb - Colab
No ratings yet
Linear Regression - Ipynb - Colab
4 pages
Regressao Linear Simples - Ipynb - Colaboratory
100% (1)
Regressao Linear Simples - Ipynb - Colaboratory
2 pages
Regression Anallysis Hands0n 1
100% (1)
Regression Anallysis Hands0n 1
3 pages
Regression Analysis for Beginners
No ratings yet
Regression Analysis for Beginners
7 pages
Regression Analysis Insights
No ratings yet
Regression Analysis Insights
11 pages
Simple Linear Regression
No ratings yet
Simple Linear Regression
5 pages
Linear Regression Report
No ratings yet
Linear Regression Report
2 pages
Data Analysis Report
No ratings yet
Data Analysis Report
16 pages
Popularity Prediction On Twitter EE239AS Project 3
No ratings yet
Popularity Prediction On Twitter EE239AS Project 3
21 pages
Model Summaries
No ratings yet
Model Summaries
1 page
BA Soln
No ratings yet
BA Soln
9 pages
S9 Regresión Simple y Múltiple Al - Colaboratory
No ratings yet
S9 Regresión Simple y Múltiple Al - Colaboratory
14 pages
CE1 Sol
No ratings yet
CE1 Sol
7 pages
Regressao Linear Multipla - Ipynb - Colaboratory
No ratings yet
Regressao Linear Multipla - Ipynb - Colaboratory
2 pages
Output - Group - Work - Project - 4652 - GWP1.ipynb - Colaboratory
No ratings yet
Output - Group - Work - Project - 4652 - GWP1.ipynb - Colaboratory
6 pages
Chapter 2
No ratings yet
Chapter 2
39 pages
EES 400 Assignment November 2024
No ratings yet
EES 400 Assignment November 2024
2 pages
Assignment: Topic - Testing For Violation of OLS Assumptions
No ratings yet
Assignment: Topic - Testing For Violation of OLS Assumptions
50 pages
Copper Linear Regression Results
No ratings yet
Copper Linear Regression Results
3 pages
ML - Lab-6.ipynb - Colab
No ratings yet
ML - Lab-6.ipynb - Colab
4 pages
Week 2 MrSumanBera HandsOn
No ratings yet
Week 2 MrSumanBera HandsOn
9 pages
Regression
No ratings yet
Regression
4 pages
Arima Model
No ratings yet
Arima Model
6 pages
ML Lab6.Ipynb - Colaboratory
100% (1)
ML Lab6.Ipynb - Colaboratory
5 pages
Outputs 1
No ratings yet
Outputs 1
3 pages
Uji Asumsi Klasik 1
No ratings yet
Uji Asumsi Klasik 1
6 pages
Estadisticas Descriptivas - DSTAT Rhs ONE, X1, X2, X3, X4, X5, X6, X7, X8, X9, X10, X11, X12$
No ratings yet
Estadisticas Descriptivas - DSTAT Rhs ONE, X1, X2, X3, X4, X5, X6, X7, X8, X9, X10, X11, X12$
4 pages
Lab Linear Regression
No ratings yet
Lab Linear Regression
21 pages
Exercise 4: Simple and Multiple Linear Regression Analysis
No ratings yet
Exercise 4: Simple and Multiple Linear Regression Analysis
15 pages
PPP Models - GARCH & NARNN - Ipynb - Colaboratory
No ratings yet
PPP Models - GARCH & NARNN - Ipynb - Colaboratory
13 pages
PPP Models - ARIMA & NARNN - Ipynb - Colaboratory
No ratings yet
PPP Models - ARIMA & NARNN - Ipynb - Colaboratory
8 pages
Problem Set 6
No ratings yet
Problem Set 6
6 pages
How To Perform Simple Linear Regression in Python
No ratings yet
How To Perform Simple Linear Regression in Python
8 pages
L10.2 2023
No ratings yet
L10.2 2023
64 pages
5
No ratings yet
5
3 pages
5
No ratings yet
5
3 pages
7
No ratings yet
7
5 pages
Kata Pengantar Vano
No ratings yet
Kata Pengantar Vano
86 pages
Ekonometrika
No ratings yet
Ekonometrika
3 pages
Noor Ul Hassan
No ratings yet
Noor Ul Hassan
6 pages
Exam
No ratings yet
Exam
6 pages
Chapter 2: Properties of The Regression Coe Cients and Hypothesis Testing
No ratings yet
Chapter 2: Properties of The Regression Coe Cients and Hypothesis Testing
5 pages
Problem Set 1
100% (2)
Problem Set 1
26 pages
Bda Assign
No ratings yet
Bda Assign
15 pages
Prac 11 Heteroscedasticity Solution
No ratings yet
Prac 11 Heteroscedasticity Solution
11 pages
Mock Test Econ
No ratings yet
Mock Test Econ
2 pages
Group Homework DH36DD01
No ratings yet
Group Homework DH36DD01
8 pages
Coding Activity 3.ipynb - Colaboratory
No ratings yet
Coding Activity 3.ipynb - Colaboratory
7 pages
4.2 Tests of Structural Changes: X y X y
No ratings yet
4.2 Tests of Structural Changes: X y X y
8 pages
Econometrics - Sheet 2A - MR - 2024
No ratings yet
Econometrics - Sheet 2A - MR - 2024
3 pages
General Regression Analysis: Y1 Versus X1, X2, X1 2, X2 2, X1 X2
No ratings yet
General Regression Analysis: Y1 Versus X1, X2, X1 2, X2 2, X1 X2
4 pages
ECMT1020 - Week 06 Workshop
No ratings yet
ECMT1020 - Week 06 Workshop
4 pages
YD Slides5 NonLin
No ratings yet
YD Slides5 NonLin
54 pages
Preboard Maths - XIIA 04.12.2023
No ratings yet
Preboard Maths - XIIA 04.12.2023
8 pages
Bfs Dfs TSP Assignment
No ratings yet
Bfs Dfs TSP Assignment
4 pages
Binary Heaps for CS Students
No ratings yet
Binary Heaps for CS Students
10 pages
A Deep Learning-Based Framework For Offensive Text Detection in Unstructured Data For Heterogeneous Social Media
No ratings yet
A Deep Learning-Based Framework For Offensive Text Detection in Unstructured Data For Heterogeneous Social Media
15 pages
Absences Machine Learning Master Modasim 2024 2025
No ratings yet
Absences Machine Learning Master Modasim 2024 2025
2 pages
Grade 10 - Modelling, Evaluating Models, Statistics
No ratings yet
Grade 10 - Modelling, Evaluating Models, Statistics
79 pages
Implementing The Weak Form in COMSOL Multiphysics - COMSOL Blog
No ratings yet
Implementing The Weak Form in COMSOL Multiphysics - COMSOL Blog
14 pages
Segpgd: An Effective and Efficient Adversarial Attack For Evaluating and Boosting Segmentation Robustness
No ratings yet
Segpgd: An Effective and Efficient Adversarial Attack For Evaluating and Boosting Segmentation Robustness
20 pages
Linear Algebra & Complex Variables Exam
No ratings yet
Linear Algebra & Complex Variables Exam
1 page
SOL - DU - MBAFT-6202 Decision Modeling and Optimization With Distributed Network
No ratings yet
SOL - DU - MBAFT-6202 Decision Modeling and Optimization With Distributed Network
45 pages
Deep Learning Optimized Dictionary Learning and Its Application in Eliminating Strong Magnetotelluric Noise
No ratings yet
Deep Learning Optimized Dictionary Learning and Its Application in Eliminating Strong Magnetotelluric Noise
22 pages
Outliers in Machine Learning
No ratings yet
Outliers in Machine Learning
13 pages
Predicting The Distribution of Stock Returns Around The Globe in The Era of Big Data and Learning
No ratings yet
Predicting The Distribution of Stock Returns Around The Globe in The Era of Big Data and Learning
61 pages
Prims Minimum Spanning Tree
No ratings yet
Prims Minimum Spanning Tree
5 pages
Slides 23quicksort
No ratings yet
Slides 23quicksort
53 pages
BPM Assignment 4
No ratings yet
BPM Assignment 4
5 pages
Mead 1992
No ratings yet
Mead 1992
14 pages
PPS Important Questions
100% (7)
PPS Important Questions
2 pages
ANN Calculations
No ratings yet
ANN Calculations
24 pages
Distance Sort
No ratings yet
Distance Sort
6 pages
Self-Directed Online Machine Learning For Topology
No ratings yet
Self-Directed Online Machine Learning For Topology
19 pages
Machine Learning (ML) in Medicine - Review, Applications, and Challenges PDF
No ratings yet
Machine Learning (ML) in Medicine - Review, Applications, and Challenges PDF
52 pages
Daa - LP 2023-24
No ratings yet
Daa - LP 2023-24
3 pages
DP 16 2 Practice
No ratings yet
DP 16 2 Practice
2 pages
Linked List
No ratings yet
Linked List
8 pages
Lecture 15
No ratings yet
Lecture 15
12 pages
Math-I (MA1003)
No ratings yet
Math-I (MA1003)
8 pages
CS607 Current 2020 Final Paper by VU Answer
No ratings yet
CS607 Current 2020 Final Paper by VU Answer
4 pages
CS403 Mcqs Mid Term by Vu Topper RM-1-1
No ratings yet
CS403 Mcqs Mid Term by Vu Topper RM-1-1
56 pages
Infinite Impulse Response Filter Design
No ratings yet
Infinite Impulse Response Filter Design
6 pages