0% found this document useful (0 votes)

20 views13 pages

Fha-Pyhton Program Unit 1-4

The document provides Python code for various statistical analyses, including frequency distribution, regression, correlation, and one-way ANOVA. It includes functions for generating data, calculating regression coefficients, visualizing data, and evaluating models. Additionally, it demonstrates how to interpret correlation coefficients and perform ANOVA using data from an Excel file.

Uploaded by

selvanveera123

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

20 views13 pages

Fha-Pyhton Program Unit 1-4

Uploaded by

selvanveera123

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 13

FREQUENCY DISTRIBUTION

import numpy as np
import pandas as pd
ef make_frequency_distribution(data, user_input=None, extra=True):
"""
Function to make frequency distribution.

Args:
data (numpy.array): data containing records.
user_input (tuple, optional):
user_input for start_value, end_value, total_classes.
Defaults to None.
extra (bool, optional): to make extra columns like cumulative,
relative frequency.

Returns:
pandas.DataFrame: required frequency distribution.
"""
## total number of observations
length = len(data)

## lowest and highest number in the data

lowest = min(data)
highest = max(data)

## total number of class

if user_input == None:
total_classes = int(np.sqrt(length))
else:
lowest, highest, total_classes = user_input

## range of the data

range_ = highest - lowest

print(f"Start value: {lowest}")

print(f"End value: {highest}")
print(f"Range: {range_}")
print(f"Total Number of Classes: {total_classes}")

## calculate width
width = range_ / total_classes

## list of all class intervals

class_intervals = [
np.round(start,3) for start in np.linspace(lowest, highest,
total_classes+1)
]
print(f"Class Width = {np.round(width, 3)}", end="\n\n")

## calculate frequency for each class

hist, _ = np.histogram(data, bins=class_intervals)

## frequency table
df = pd.DataFrame(
{
"Class Intervals": [
f"{first} - under {second}" \
for first, second in zip(class_intervals,
class_intervals[1:])
],
"Frequency": hist
}
)

if extra:
## class midpoint
df["Class Midpoint"] = df["Class Intervals"].apply(
lambda x: (
( float(x.split(' ')[0]) + float(x.split(' ')[-1]) ) / 2
)
)

## relative frequency
df["Relative Frequency"] = df["Frequency"] / df["Frequency"].sum()

## cumulative frequency
df["Cumulative Frequency"] = df["Frequency"].cumsum()

return df

## data
test_scores = np.array([
52, 92, 84, 74, 65, 55, 78, 95, 62,
72, 64, 74, 82, 94, 71, 79, 73, 94,
77, 53, 77, 87, 97, 57, 72, 89, 76,
91, 86, 99, 71, 73, 58, 76, 33, 78, 69
])

## without specifying user input

make_frequency_distribution(test_scores)
Start value: 33
End value: 99
Range: 66
Total Number of Classes: 6
Class Width = 11.0

Class Frequenc Class Relative Cumulative

Intervals y Midpoint Frequency Frequency

33.0 - under
0 1 38.5 0.027027 1
44.0

44.0 - under
1 2 49.5 0.054054 3
55.0

55.0 - under
2 6 60.5 0.162162 9
66.0

66.0 - under
3 11 71.5 0.297297 20
77.0

77.0 - under
4 9 82.5 0.243243 29
88.0

88.0 - under
5 8 93.5 0.216216 37
99.0

HYPOTHESIS TESING
PROBABILITY DISTRIBUTION
REGRESSION

import numpy as np
import matplotlib.pyplot as plt

def generate_data(size=100, seed=None):

if seed is not None:
np.random.seed(seed)
independent_variable = np.random.rand(size) * 30 # Independent
variable with variability
noise = np.random.randn(size) * 5 # Noise for variability in the
dependent variable
dependent_variable = 2 * independent_variable + 10 + noise #
Dependent variable with a linear relationship
return independent_variable, dependent_variable
def calculate_regression_coefficients(x, y):
x_mean, y_mean = np.mean(x), np.mean(y)
numerator = np.sum((x - x_mean) * (y - y_mean))
denominator = np.sum((x - x_mean)**2)
slope = numerator / denominator
intercept = y_mean - slope * x_mean
return slope, intercept
def create_regression_line(x, slope, intercept):
return slope * x + intercept

def visualize_data_and_regression(x, y, slope, intercept):

plt.scatter(x, y, alpha=0.7, label='Data Points')
regression_line = create_regression_line(x, slope, intercept)
plt.plot(x, regression_line, color='red', label='Regression Line')
plt.title('Scatterplot with Regression Line')
plt.xlabel('Independent Variable')
plt.ylabel('Dependent Variable')
plt.legend()
#plt.grid(True)
plt.show()
def predict(slope, intercept, x):
return slope * x + intercept
def evaluate_model(actual, predicted):
mse = np.mean((actual - predicted)**2)
r_squared = 1 - (np.sum((actual - predicted)**2) / np.sum((actual -
np.mean(actual))**2))
return mse, r_squared
def draw_conclusions(slope, intercept, mse, r_squared):
print(f"Slope: {slope}")
print(f"Intercept: {intercept}")
print(f"Mean Squared Error (MSE): {mse}")
print(f"R-squared: {r_squared}")
# Main Program
independent_variable, dependent_variable = generate_data(seed=42)
slope, intercept = calculate_regression_coefficients(independent_variable,
dependent_variable)

visualize_data_and_regression(independent_variable, dependent_variable,
slope, intercept)

predictions = predict(slope, intercept, independent_variable)

mse, r_squared = evaluate_model(dependent_variable, predictions)

draw_conclusions(slope, intercept, mse, r_squared)

CORRELATION

import numpy as np
import matplotlib.pyplot as plt

# Generate Data
def generate_data(size=100, seed=None):
if seed is not None:
np.random.seed(seed)
variable1 = np.random.rand(size) * 30 # First variable with
variability
variable2 = variable1 + np.random.randn(size) * 10 # Second variable
with variability and a linear relationship
return variable1, variable2
# Calculate Correlation Coefficient
def calculate_correlation_coefficient(x, y):
covariance_matrix = np.cov(x, y)
correlation_coefficient = covariance_matrix[0, 1] / (np.std(x) *
np.std(y))
return correlation_coefficient
# Create Scatter plot

def create_scatter_plot(x, y):

plt.scatter(x, y, alpha=0.7)
plt.title('Scatterplot of Variable 1 vs Variable 2')
plt.xlabel('Variable 1')
plt.ylabel('Variable 2')
plt.grid(True)
plt.show()
# Interpret Scatter plot
def interpret_correlation_coefficient(correlation_coefficient):
if correlation_coefficient> 0:
correlation_type = "positive"
elif correlation_coefficient< 0:
correlation_type = "negative"
else:
correlation_type = "no apparent"
return correlation_type
# Experiment
seed = 42 # Change the seed to observe different scenarios
variable1, variable2 = generate_data(seed=seed)
correlation_coefficient = calculate_correlation_coefficient(variable1,
variable2)
create_scatter_plot(variable1,variable2)
print(f"Pearson Correlation Coefficient: {correlation_coefficient}")
correlation_type =
interpret_correlation_coefficient(correlation_coefficient)
print(f"The scatterplot shows a {correlation_type} correlation.")
ONE WAY ANOVA- COMPLETELY RANDOMIZED DESIGN
import pandas as pd
import numpy as np
import math
from scipy import stats
import scipy
import statsmodels.api as sm
from statsmodels.formula.api import ols
from matplotlib import pyplot as plt

data=pd.read_excel('/content/tm.xlsx')
data

AD3411 DATA SCIENCE AND ANALYTICS LAB (2) - Removed
No ratings yet
AD3411 DATA SCIENCE AND ANALYTICS LAB (2) - Removed
24 pages
FDSA Lab Manual
No ratings yet
FDSA Lab Manual
27 pages
Stats Lab (7-9)
No ratings yet
Stats Lab (7-9)
8 pages
4 12
No ratings yet
4 12
17 pages
Fda Batch2program
No ratings yet
Fda Batch2program
18 pages
FDSA Lab Manual
No ratings yet
FDSA Lab Manual
31 pages
Ad3411 - Data Science and Analytics Laboratory
No ratings yet
Ad3411 - Data Science and Analytics Laboratory
26 pages
Time Series Analysis Group 9
No ratings yet
Time Series Analysis Group 9
16 pages
Dsa Lab
No ratings yet
Dsa Lab
28 pages
Python Code - Summary Statistics
No ratings yet
Python Code - Summary Statistics
6 pages
Ex. No.: 01 Working With Numpy Arrays
No ratings yet
Ex. No.: 01 Working With Numpy Arrays
30 pages
Data Science and Analtics Laboratory
No ratings yet
Data Science and Analtics Laboratory
21 pages
Ad3411 - Dsa Lab Manual
No ratings yet
Ad3411 - Dsa Lab Manual
34 pages
Data Science and Analtics Laboratory
No ratings yet
Data Science and Analtics Laboratory
21 pages
AD3411
No ratings yet
AD3411
28 pages
Python Codes
No ratings yet
Python Codes
15 pages
FDS Lab 1 Manuel .1..1new
No ratings yet
FDS Lab 1 Manuel .1..1new
34 pages
Ankit Python
No ratings yet
Ankit Python
26 pages
Lab 13
No ratings yet
Lab 13
5 pages
Ad3411-Data Science and Analytics Laboratory
No ratings yet
Ad3411-Data Science and Analytics Laboratory
27 pages
Ad3411 - Student
No ratings yet
Ad3411 - Student
27 pages
DVA Lab Manual
No ratings yet
DVA Lab Manual
20 pages
DA Lab ANSWERS
No ratings yet
DA Lab ANSWERS
10 pages
Dsa Lab Manual
No ratings yet
Dsa Lab Manual
17 pages
Vanshika Goyal Gec Practicals
No ratings yet
Vanshika Goyal Gec Practicals
31 pages
Fdsa Lab Manual
No ratings yet
Fdsa Lab Manual
17 pages
Lab Manual (DAV)
No ratings yet
Lab Manual (DAV)
33 pages
Data Analysis and Visualization Guide
No ratings yet
Data Analysis and Visualization Guide
16 pages
Print Print Print Print: Import As
No ratings yet
Print Print Print Print: Import As
6 pages
FDSA Lab Record
No ratings yet
FDSA Lab Record
30 pages
Machine Learning
No ratings yet
Machine Learning
31 pages
AD3411 - 1 To 5
No ratings yet
AD3411 - 1 To 5
11 pages
Pandas & NumPy Data Analysis Guide
No ratings yet
Pandas & NumPy Data Analysis Guide
11 pages
Gec Practicals
No ratings yet
Gec Practicals
31 pages
Statistical Exp 8
No ratings yet
Statistical Exp 8
9 pages
DSF Lab
No ratings yet
DSF Lab
14 pages
ML Lab
No ratings yet
ML Lab
14 pages
FDS Lab Question Bank
No ratings yet
FDS Lab Question Bank
11 pages
Stat Lab
No ratings yet
Stat Lab
24 pages
Solution8 12
No ratings yet
Solution8 12
12 pages
Hariks
No ratings yet
Hariks
5 pages
FDS Lab 1 Manuel .1..1new
No ratings yet
FDS Lab 1 Manuel .1..1new
38 pages
Data Science Algorithmen Master - 02 Data Handling
No ratings yet
Data Science Algorithmen Master - 02 Data Handling
76 pages
Data Science Practical Book - Ipynb
No ratings yet
Data Science Practical Book - Ipynb
21 pages
ML (Sudhanshu)
No ratings yet
ML (Sudhanshu)
24 pages
ML Record
No ratings yet
ML Record
19 pages
Data Science Experiment Guide
100% (2)
Data Science Experiment Guide
43 pages
Experimenting With Data Analysis Packages and Statistical Operations
No ratings yet
Experimenting With Data Analysis Packages and Statistical Operations
18 pages
Datascience Lab
No ratings yet
Datascience Lab
24 pages
Data Science Lab Manual
No ratings yet
Data Science Lab Manual
32 pages
MLFILE
No ratings yet
MLFILE
21 pages
Chandigarh Group of Colleges College of Engineering Landran, Mohali
No ratings yet
Chandigarh Group of Colleges College of Engineering Landran, Mohali
47 pages
FDSA Lab Manual 1
No ratings yet
FDSA Lab Manual 1
34 pages
Computational Sem 5
No ratings yet
Computational Sem 5
20 pages
DA Manual - Part B
No ratings yet
DA Manual - Part B
13 pages
Pattern Recognition
No ratings yet
Pattern Recognition
26 pages
Mayank Chaudhary DEV Practicals
No ratings yet
Mayank Chaudhary DEV Practicals
14 pages
Dal Programs With Output
No ratings yet
Dal Programs With Output
11 pages
Fdsa Lab Algorithm
No ratings yet
Fdsa Lab Algorithm
21 pages
English Language: 8700/2 Paper 2 Writers' Viewpoints and Perspectives Mark Scheme
No ratings yet
English Language: 8700/2 Paper 2 Writers' Viewpoints and Perspectives Mark Scheme
20 pages
Aviation Security Manual Doc 8973 Restricted
0% (2)
Aviation Security Manual Doc 8973 Restricted
2 pages
Codon Populations in Single-Stranded Whole Human Genome DNA Are Fractal and Fine-Tuned by The Golden Ratio 1.618
No ratings yet
Codon Populations in Single-Stranded Whole Human Genome DNA Are Fractal and Fine-Tuned by The Golden Ratio 1.618
13 pages
Lesson Planning for Teachers
100% (2)
Lesson Planning for Teachers
17 pages
Pace Book 1
No ratings yet
Pace Book 1
44 pages
Beam FLexure
No ratings yet
Beam FLexure
4 pages
Physics Ig
No ratings yet
Physics Ig
41 pages
Journey of Hero
No ratings yet
Journey of Hero
15 pages
5-Phase Project Management Guide
No ratings yet
5-Phase Project Management Guide
20 pages
Das 2016
No ratings yet
Das 2016
8 pages
Continuous Assessment School Placement 1 Reflective Essay: Gmit Examinations - 2016/17
No ratings yet
Continuous Assessment School Placement 1 Reflective Essay: Gmit Examinations - 2016/17
4 pages
Biological Control of Bacterial Wilt in Tomatoes
No ratings yet
Biological Control of Bacterial Wilt in Tomatoes
7 pages
Fire Blocks
No ratings yet
Fire Blocks
6 pages
LabVIEW - Zadaci 1
No ratings yet
LabVIEW - Zadaci 1
5 pages
The Concept of Public Space and Its Democratic Manifestations PDF
No ratings yet
The Concept of Public Space and Its Democratic Manifestations PDF
24 pages
Apollo Hospitals Food Demand Forecasting
100% (4)
Apollo Hospitals Food Demand Forecasting
5 pages
Aboriginal History V28
100% (1)
Aboriginal History V28
242 pages
Optical Flow Visualization Methods
No ratings yet
Optical Flow Visualization Methods
21 pages
Reliabilityweb Uptime 20120203
100% (1)
Reliabilityweb Uptime 20120203
69 pages
PERT-CPM-WBS (ES 12 Engineering Management)
100% (1)
PERT-CPM-WBS (ES 12 Engineering Management)
70 pages
Network Configurations & Topologies
No ratings yet
Network Configurations & Topologies
4 pages
Networking Basics for Beginners
No ratings yet
Networking Basics for Beginners
39 pages
Chapter 5 - Discrete Random Variables and Their Probability Distrubutions
No ratings yet
Chapter 5 - Discrete Random Variables and Their Probability Distrubutions
9 pages
NSTP 2 MMMM
No ratings yet
NSTP 2 MMMM
7 pages
NCVTCTSCertificateAnnual R200809249472
100% (1)
NCVTCTSCertificateAnnual R200809249472
1 page
Topic - 4 Swing Trading
0% (1)
Topic - 4 Swing Trading
3 pages
Ivan Sutherland - Characterization of Ten Hidden-Surface Algorithms (1974)
No ratings yet
Ivan Sutherland - Characterization of Ten Hidden-Surface Algorithms (1974)
55 pages
BI Apps 11.1.1.7.1 Installation and Configuration
No ratings yet
BI Apps 11.1.1.7.1 Installation and Configuration
117 pages
Chapter 7 - Trust, Justice and Ethics
No ratings yet
Chapter 7 - Trust, Justice and Ethics
7 pages

Fha-Pyhton Program Unit 1-4

Uploaded by

Fha-Pyhton Program Unit 1-4

Uploaded by

FREQUENCY DISTRIBUTION

## lowest and highest number in the data

## total number of class

## range of the data

print(f"Start value: {lowest}")

## list of all class intervals

## calculate frequency for each class

## without specifying user input

Class Frequenc Class Relative Cumulative

def generate_data(size=100, seed=None):

def visualize_data_and_regression(x, y, slope, intercept):

predictions = predict(slope, intercept, independent_variable)

draw_conclusions(slope, intercept, mse, r_squared)

def create_scatter_plot(x, y):

You might also like