Linear Regression Model

Industrial 4.0 copy

Uploaded by

normaluseabhishek

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

6 views4 pages

Linear Regression Model

Industrial 4.0 copy

Uploaded by

normaluseabhishek

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

Aim: Predicting Sales from Advertisement Data Using Linear Regression for Smart Business

Modeling
Software Tools: Google Collab,
Libraries: pandas (pd) → For reading the CSV file and handling tabular data.
numpy (np) → For numerical calculations (mean, sum, array operations).
matplotlib.pyplot (plt) → For visualizing the dataset and regression results.

Description: This demonstrates predicting sales from advertisement data using a simple linear
regression model implemented from scratch.
1. Data Upload & Loading → The Advertising.csv file is uploaded, cleaned (column names
stripped of spaces), and displayed.
2. Feature Selection → TV advertising budget is chosen as the input feature (X) and sales as the
output target (Y).
3. Data Splitting → The dataset is manually split into training and test sets.
4. Model Building →
o Slope (m) and intercept (b) are calculated using statistical formulas.
o The regression line is defined as:
o 𝑦 = 𝑚𝑥 + 𝑐
5. Visualization → Scatter plots show actual data points and the fitted regression line.
6. Prediction → Sales prediction is made for a TV ad budget of ₹50,000.
7. Model Testing → Predicted sales are compared with actual test set sales using a scatter plot.
8. Performance Evaluation →
o Mean Squared Error (MSE) measures average error.
o R-squared indicates how well the model explains variance in sales.

Code:

# Step 1: Upload your Advertising.csv file

from google.colab import files
uploaded = files.upload()

# Step 2: Import required libraries

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# Step 3: Load dataset

# Get the uploaded file name
uploaded_file_name = list(uploaded.keys())[0]
data = pd.read_csv(uploaded_file_name)

# Clean column names in case there are spaces or casing issues

data.columns = data.columns.str.strip()

# Display the dataset

print("First 5 rows of dataset:")
print(data.head())
print("Column Names:", data.columns)

# Step 4: Extract Feature (TV) and Target (Sales) variables

x = data['TV'].values
y = data['Sales'].values

# Step 5: Split dataset into training and test sets

x_train = x[:150]
x_test = x[150:]
y_train = y[:150]
y_test = y[150:]

# Step 6: Define helper functions

def errors_product(x, y):
return np.sum((x - np.mean(x)) * (y - np.mean(y)))

def squared_errors(x):
return np.sum((x - np.mean(x))**2)

# Step 7: Calculate slope and intercept

slope = errors_product(x_train, y_train) / squared_errors(x_train)
intercept = np.mean(y_train) - slope * np.mean(x_train)

print(f"Slope: {slope}")
print(f"Intercept: {intercept}")

# Step 8: Plot the best fit regression line

plt.figure(figsize=(8, 5))
plt.scatter(x, y, color='red', marker='o')
plt.plot(x, slope * x + intercept, color='black', linewidth=2)
plt.title('Regression Line: TV Advertisement vs Sales')
plt.xlabel('TV Advertisement Expense (₹1000s)')
plt.ylabel('Sales (Units in 1000s)')
plt.legend(['Best Fit Line', 'Data'])
plt.grid(True)
plt.show()

# Step 9: Predict sales for Rs. 50,000 spent on TV ads

def sales_predicted(tv_budget_k):
return slope * tv_budget_k + intercept

predicted_sales = sales_predicted(50) * 1000 # rescale back

print(f"Predicted Sales for Rs 50,000 spent on TV ads:
{predicted_sales}")

# Step 10: Compare original and predicted test data

y_predicted = slope * x_test + intercept

plt.figure(figsize=(8, 5))
plt.scatter(x_test, y_test, color='red', marker='o')
plt.scatter(x_test, y_predicted, color='black', marker='+')
plt.title('Original vs Predicted Sales (Test Set)')
plt.xlabel('TV Advertisement Expense ($1000s)')
plt.ylabel('Sales (Units in 1000s)')
plt.legend(['Original', 'Predicted'])
plt.grid(True)
plt.show()

# Step 11: Evaluate model performance

mean_error = np.mean((y_test - y_predicted)**2)
r_squared = np.corrcoef(y_test, y_predicted)[0, 1]**2

print(f"Mean Squared Error: {mean_error}")

print(f"R-squared Value: {r_squared}")

Output:
Saving Advertising.csv to Advertising (3).csv
First 5 rows of dataset:
Unnamed: 0 TV Radio Newspaper Sales
0 1 230.1 37.8 69.2 22.1
1 2 44.5 39.3 45.1 10.4
2 3 17.2 45.9 69.3 9.3
3 4 151.5 41.3 58.5 18.5
4 5 180.8 10.8 58.4 12.9
Column Names: Index(['Unnamed: 0', 'TV', 'Radio', 'Newspaper',
'Sales'], dtype='object')
Slope: 0.04906288039571123
Intercept: 7.110732084446855

Lab5 MLR
No ratings yet
Lab5 MLR
12 pages
CS250 - Simple Linear Regression Project - Saylor Academy - Saylor Academy
No ratings yet
CS250 - Simple Linear Regression Project - Saylor Academy - Saylor Academy
9 pages
Sales
No ratings yet
Sales
7 pages
1.3 - Multiple Linear Regression
No ratings yet
1.3 - Multiple Linear Regression
13 pages
Linear Regression - Jupyter Notebook
100% (3)
Linear Regression - Jupyter Notebook
56 pages
Linear Regression for Beginners
No ratings yet
Linear Regression for Beginners
46 pages
Ds Lab 4.ipynb - TARUN
No ratings yet
Ds Lab 4.ipynb - TARUN
6 pages
Ds - Lab - 4.ipynb - Colab
No ratings yet
Ds - Lab - 4.ipynb - Colab
7 pages
ml1 PRG
No ratings yet
ml1 PRG
2 pages
Exemplar - Perform Multiple Linear Regression
No ratings yet
Exemplar - Perform Multiple Linear Regression
20 pages
Linear Regression
No ratings yet
Linear Regression
20 pages
Abhishek Pandey - BI Lab - Exp 3
No ratings yet
Abhishek Pandey - BI Lab - Exp 3
8 pages
Exemplar - Hypothesis Testing With Python
No ratings yet
Exemplar - Hypothesis Testing With Python
14 pages
Linear Regression
No ratings yet
Linear Regression
8 pages
Practical # 10
No ratings yet
Practical # 10
5 pages
UNIT6
No ratings yet
UNIT6
8 pages
0.1 Advertising Dataset: Linear Regression and Model Assumption
No ratings yet
0.1 Advertising Dataset: Linear Regression and Model Assumption
42 pages
Linear Regression for Data Science
No ratings yet
Linear Regression for Data Science
30 pages
Assumption of Linear Regression
No ratings yet
Assumption of Linear Regression
6 pages
Lecture 9-10
No ratings yet
Lecture 9-10
28 pages
INDUSTRY 2 Akshat
No ratings yet
INDUSTRY 2 Akshat
12 pages
Chapter3 First Application Linear Regression
No ratings yet
Chapter3 First Application Linear Regression
8 pages
Linear Regression: What Is Regression Analysis?
100% (1)
Linear Regression: What Is Regression Analysis?
21 pages
Linear Regression for Sales and Advertising
No ratings yet
Linear Regression for Sales and Advertising
14 pages
Sales Prediction Using Python
No ratings yet
Sales Prediction Using Python
6 pages
Supply Chain Analytics
No ratings yet
Supply Chain Analytics
8 pages
Question 1_ Simple Linear Regression_You are provided with a CSV file named `Advertising.csv`, containing four columns_ `TV`, `Radio`, `Newspaper`, and `Sales`. Your task is to perform a simple linear regressio (1)
No ratings yet
Question 1_ Simple Linear Regression_You are provided with a CSV file named `Advertising.csv`, containing four columns_ `TV`, `Radio`, `Newspaper`, and `Sales`. Your task is to perform a simple linear regressio (1)
1 page
DS Unit 4
No ratings yet
DS Unit 4
21 pages
Assignment 2
No ratings yet
Assignment 2
5 pages
Linear Regression3.0
No ratings yet
Linear Regression3.0
24 pages
Unit II - Diagnotis and Multiple Linear
No ratings yet
Unit II - Diagnotis and Multiple Linear
8 pages
Linear Regression for Analysts
No ratings yet
Linear Regression for Analysts
22 pages
Linear Regression Lab
No ratings yet
Linear Regression Lab
4 pages
DS Food
No ratings yet
DS Food
23 pages
New cp3
No ratings yet
New cp3
6 pages
Simple Linear Regression Guide
No ratings yet
Simple Linear Regression Guide
26 pages
Linear Regression - Numpy and Sklearn
No ratings yet
Linear Regression - Numpy and Sklearn
7 pages
Lab Mannual of ML
No ratings yet
Lab Mannual of ML
43 pages
DMV Unit 3 PPT - RSK - 250419 - 125620 Jfhuehiwhu
No ratings yet
DMV Unit 3 PPT - RSK - 250419 - 125620 Jfhuehiwhu
89 pages
ML Combined
No ratings yet
ML Combined
254 pages
DSunit 2
No ratings yet
DSunit 2
4 pages
Cap8 Predicting Continuous Target Variables With Regression Analysis - Thakur Ankita 2016 - Python Real World Data Science
No ratings yet
Cap8 Predicting Continuous Target Variables With Regression Analysis - Thakur Ankita 2016 - Python Real World Data Science
36 pages
ml2020 Pythonlab02
No ratings yet
ml2020 Pythonlab02
3 pages
Machine Exercise 3
No ratings yet
Machine Exercise 3
22 pages
Python Simple Linear Regression Guide
No ratings yet
Python Simple Linear Regression Guide
14 pages
Lab 02 Group 05
No ratings yet
Lab 02 Group 05
2 pages
Machine Learning and Linear Regression
100% (1)
Machine Learning and Linear Regression
55 pages
Task05 Salespredictionusingpython 1752340936
No ratings yet
Task05 Salespredictionusingpython 1752340936
3 pages
Machine Learning 2
No ratings yet
Machine Learning 2
45 pages
ML 1-11
No ratings yet
ML 1-11
27 pages
SiddharthShah 1032221195 DivC 50 DL LabAssignment2
No ratings yet
SiddharthShah 1032221195 DivC 50 DL LabAssignment2
7 pages
Unit 2 Regression Analysis
No ratings yet
Unit 2 Regression Analysis
16 pages
FINAL - CC01 - Group7
No ratings yet
FINAL - CC01 - Group7
23 pages
Final Cc01 Group7
No ratings yet
Final Cc01 Group7
23 pages
d3 It ML Jan 2023 Part 2
No ratings yet
d3 It ML Jan 2023 Part 2
32 pages
Group 1 Practical
No ratings yet
Group 1 Practical
16 pages
Int Assignment
No ratings yet
Int Assignment
4 pages
BFF2612 Project Report
No ratings yet
BFF2612 Project Report
37 pages
TSA Book
No ratings yet
TSA Book
154 pages
2019 - Artigo - Static Structural Analysis of Pratt, Flink and Howe Steel Truss Using Ansys Software
No ratings yet
2019 - Artigo - Static Structural Analysis of Pratt, Flink and Howe Steel Truss Using Ansys Software
8 pages
NRC 2018 Rules & Regulations Football
No ratings yet
NRC 2018 Rules & Regulations Football
14 pages
600 Questões Sobre Inspeção de Soldagem Incluíndo Gabarito e Caderno de Desenhos
No ratings yet
600 Questões Sobre Inspeção de Soldagem Incluíndo Gabarito e Caderno de Desenhos
9 pages
A. Introduction Handouts
No ratings yet
A. Introduction Handouts
6 pages
Functional Safety Certificate: ICO3S, ICO4S, ICO4D, ICO4N and SOV 1 To 6
100% (1)
Functional Safety Certificate: ICO3S, ICO4S, ICO4D, ICO4N and SOV 1 To 6
5 pages
Angry Birds UML Class 2.0
No ratings yet
Angry Birds UML Class 2.0
1 page
Project Design Brief (G2)
No ratings yet
Project Design Brief (G2)
1 page
SchoolBus Web Studyguide 2019
100% (1)
SchoolBus Web Studyguide 2019
44 pages
Implementing A Multi-Domain System: Siemens Digital Industries Software
No ratings yet
Implementing A Multi-Domain System: Siemens Digital Industries Software
9 pages
Air Regulations RK Bali PDF
38% (8)
Air Regulations RK Bali PDF
1 page
Internship Report
No ratings yet
Internship Report
25 pages
Kuka
100% (2)
Kuka
13 pages
Addition Tips and Tricks
No ratings yet
Addition Tips and Tricks
11 pages
Firmware Update Log for Engineers
No ratings yet
Firmware Update Log for Engineers
2 pages
Water Plant Project Bidding Guide
No ratings yet
Water Plant Project Bidding Guide
32 pages
Modbus Scan Task User's Guide, July 21, 2011 PDF
No ratings yet
Modbus Scan Task User's Guide, July 21, 2011 PDF
62 pages
Participant Guide: Xerox 6204 Wide Format Solution
No ratings yet
Participant Guide: Xerox 6204 Wide Format Solution
72 pages
Bharath Kumar Nageli's Resume
No ratings yet
Bharath Kumar Nageli's Resume
2 pages
OB81 Ps - FLT PDF
100% (1)
OB81 Ps - FLT PDF
5 pages
Comparision Sheet Colour Printer
No ratings yet
Comparision Sheet Colour Printer
4 pages
E Peas AEM10941 Datasheet Solar Energy Harvesting
No ratings yet
E Peas AEM10941 Datasheet Solar Energy Harvesting
25 pages
Penawaran LagoonAvenue - Aiscomm
No ratings yet
Penawaran LagoonAvenue - Aiscomm
3 pages
Ôn tập deadlock - bài tập lập lịch cho CPU - TRẦN THỊ NHẬT LINH
No ratings yet
Ôn tập deadlock - bài tập lập lịch cho CPU - TRẦN THỊ NHẬT LINH
8 pages
Account 421
No ratings yet
Account 421
537 pages
Descargar Pergaminos de Cristal Claudio Pasten
No ratings yet
Descargar Pergaminos de Cristal Claudio Pasten
3 pages
Travel Email
No ratings yet
Travel Email
2 pages
SGP 22-v3 1
No ratings yet
SGP 22-v3 1
501 pages