0% found this document useful (0 votes)

16 views4 pages

Notebook - Main Code

Uploaded by

golgothgolgoth039

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

16 views4 pages

Notebook - Main Code

Uploaded by

golgothgolgoth039

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

import os

import argparse
import numpy as np
import pandas as pd
import mlflow
import mlflow.sklearn
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import classification_report
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix,classification_report
from sklearn.metrics import accuracy_score
from sklearn import preprocessing

def main():
"""Main function of the script."""

# input and output arguments

parser = argparse.ArgumentParser()
parser.add_argument("--data", type=str, help="path to input data")
parser.add_argument("--test_train_ratio", type=float, default=0.25)
parser.add_argument("--criterion", default="gini", type=str)
parser.add_argument("--random_state", type=int)
parser.add_argument("--
registered_model_name", type=str, help="model name")
args = parser.parse_args()

# Start Logging
mlflow.start_run()

# enable autologging
mlflow.sklearn.autolog()

###################
#<prepare the data>
###################
print(" ".join(f"{k}={v}" for k, v in vars(args).items()))

print("input data:", args.data)

#kidney_df = pd.read_csv(args.data, header=1, index_col=0)
dataset = pd.read_csv(args.data)

mlflow.log_metric("num_samples", dataset.shape[0])
mlflow.log_metric("num_features", dataset.shape[1] - 1)

#----#
# removing extra '\t' from data
for ij in range (0,25):
if dataset.dtypes[ij]!='int64':
dataset.iloc[:,ij]=dataset.iloc[:,ij].astype('str').map(lambda x:
x.lstrip('\t').rstrip('\t'))

# Some additional data cleaning

dataset.replace(' yes','yes',inplace=True)
dataset['class'].replace('no','notckd',inplace=True)
dataset.replace('?',np.nan,inplace=True)

#For loop to do soft conversion of columns wherever possible leaving non-

object and unconvertible column unchanged.
cols = dataset.columns
for c in cols:
try:
dataset[c] = pd.to_numeric(dataset[c])
except:
pass

array=dataset.copy()

inputs=array.drop('class',axis='columns')
target=array['class']

#LabelEncoding
labelencoder=preprocessing.LabelEncoder()

X=inputs.values
#y=inputs.values
y=target

for ij in range(0,24):
X[:,ij]=labelencoder.fit_transform(X[:,ij])
#----#

#Split train and test datasets

#train_df, test_df = train_test_split(

X_train,X_test,y_train,y_test= train_test_split(
X,
y,
test_size=args.test_train_ratio,
random_state=args.random_state,
)
####################
#</prepare the data>
####################

##################
#<train the model>
##################
# Extracting the label column
#y_train = train_df.pop("24")

# convert the dataframe values to array

#X_train = train_df.values

# Extracting the label column

#y_test = test_df.pop("24")

# convert the dataframe values to array

#X_test = test_df.values

print(f"Training with data of shape {X_train.shape}")

decision_tree = DecisionTreeClassifier(
criterion=args.criterion,random_state = args.random_state
)
decision_tree.fit(X_train,y_train)

y_pred = decision_tree.predict(X_test)

print(classification_report(y_test, y_pred))
###################
#</train the model>
###################

##########################
#<save and register model>
##########################
# Registering the model to the workspace
print("Registering the model via MLFlow")
mlflow.sklearn.log_model(
sk_model=decision_tree,
registered_model_name=args.registered_model_name,
artifact_path=args.registered_model_name,
)

# Saving the model to a file

mlflow.sklearn.save_model(
sk_model=decision_tree,
path=os.path.join(args.registered_model_name, "trained_model"),
)
###########################
#</save and register model>
###########################

# Stop Logging
mlflow.end_run()

if __name__ == "__main__":
main()

Tensor Flow and Keras Sample Programs
No ratings yet
Tensor Flow and Keras Sample Programs
22 pages
Code and Output of Cancer Detection Model
No ratings yet
Code and Output of Cancer Detection Model
13 pages
Multi Classification - Py (For 1 Class TP, TN, FP, FN)
No ratings yet
Multi Classification - Py (For 1 Class TP, TN, FP, FN)
25 pages
MlLabManualdocx 2024 09 04 22 02 58
No ratings yet
MlLabManualdocx 2024 09 04 22 02 58
19 pages
ML Codes
No ratings yet
ML Codes
9 pages
DLL 4
No ratings yet
DLL 4
26 pages
Nibedita Dehury, 123CE0079, ASSIGNMENT 9
No ratings yet
Nibedita Dehury, 123CE0079, ASSIGNMENT 9
18 pages
Pattern Recognition Lab
No ratings yet
Pattern Recognition Lab
24 pages
Data Preprocessing
No ratings yet
Data Preprocessing
9 pages
Raw Nitex
No ratings yet
Raw Nitex
5 pages
Shobit Sharma (2124399) ML Lab File PDF
No ratings yet
Shobit Sharma (2124399) ML Lab File PDF
19 pages
AI
No ratings yet
AI
16 pages
16BCB0126 VL2018195002535 Pe003
No ratings yet
16BCB0126 VL2018195002535 Pe003
40 pages
Deep Learning with Keras Guide
No ratings yet
Deep Learning with Keras Guide
12 pages
AI ML - Cycle 2 Programs
No ratings yet
AI ML - Cycle 2 Programs
15 pages
Car Evaluation Data Analysis & Random Forest Model
No ratings yet
Car Evaluation Data Analysis & Random Forest Model
12 pages
ML Functions
No ratings yet
ML Functions
12 pages
Aiml Ex 4-7
No ratings yet
Aiml Ex 4-7
8 pages
Keras Cheat Sheet Python
No ratings yet
Keras Cheat Sheet Python
1 page
Train Edu Bert
No ratings yet
Train Edu Bert
3 pages
Document 4
No ratings yet
Document 4
3 pages
Prgm8.Ipynb - Colab
No ratings yet
Prgm8.Ipynb - Colab
2 pages
Skin Disease Detection Using Transformers
No ratings yet
Skin Disease Detection Using Transformers
35 pages
Deep Learning Perceptron
No ratings yet
Deep Learning Perceptron
10 pages
PYHTONPRACT
No ratings yet
PYHTONPRACT
4 pages
Untitled Document
No ratings yet
Untitled Document
6 pages
ML Lab Manual
No ratings yet
ML Lab Manual
12 pages
ML NEW Final Format
No ratings yet
ML NEW Final Format
37 pages
ML Lab
No ratings yet
ML Lab
29 pages
Reast Cancer Prediction Using Debt
No ratings yet
Reast Cancer Prediction Using Debt
18 pages
Assignment 3
No ratings yet
Assignment 3
8 pages
Assignment 2.4.1 Multiclass Classification
No ratings yet
Assignment 2.4.1 Multiclass Classification
5 pages
A3 Classification and Feature Engineering
No ratings yet
A3 Classification and Feature Engineering
2 pages
AI Assignment-6
No ratings yet
AI Assignment-6
7 pages
ML Lab 01999676272
No ratings yet
ML Lab 01999676272
12 pages
Linearregression SVM
No ratings yet
Linearregression SVM
3 pages
TP - Ipynb - Colab
No ratings yet
TP - Ipynb - Colab
6 pages
Final ML Programs 075005
No ratings yet
Final ML Programs 075005
15 pages
Brain Tumor Multi-Classification With PSO: Import As Import As Import
No ratings yet
Brain Tumor Multi-Classification With PSO: Import As Import As Import
18 pages
SVM K NN MLP With Sklearn Jupyter NoteBo
No ratings yet
SVM K NN MLP With Sklearn Jupyter NoteBo
22 pages
Programs Lab Bca
No ratings yet
Programs Lab Bca
16 pages
Program
No ratings yet
Program
10 pages
Python Essential Methods in Machine Learning
No ratings yet
Python Essential Methods in Machine Learning
6 pages
EX - NO:3: Algorithm
No ratings yet
EX - NO:3: Algorithm
11 pages
ML Minimized Programs
No ratings yet
ML Minimized Programs
9 pages
ML Practical 205160694034
No ratings yet
ML Practical 205160694034
33 pages
ML Fat
No ratings yet
ML Fat
9 pages
Ann Experiential Learning
No ratings yet
Ann Experiential Learning
43 pages
ML II Lab
No ratings yet
ML II Lab
5 pages
MLA Lab 6:-Implementation of Decision Tree
No ratings yet
MLA Lab 6:-Implementation of Decision Tree
16 pages
ML Manual With Outputs
No ratings yet
ML Manual With Outputs
30 pages
Deep Learning Practical Assignment:: Q-1) Code
No ratings yet
Deep Learning Practical Assignment:: Q-1) Code
59 pages
RAGE Against The Machine - Retrieval-Augmented LLM Explanations
No ratings yet
RAGE Against The Machine - Retrieval-Augmented LLM Explanations
4 pages
Time Series Analysis 1718649022
No ratings yet
Time Series Analysis 1718649022
5 pages
Programming With Python and GUI Development... 2024
No ratings yet
Programming With Python and GUI Development... 2024
145 pages
Stock Market Dashboard in Python
No ratings yet
Stock Market Dashboard in Python
4 pages
Notebook - Deep Neural Networks
No ratings yet
Notebook - Deep Neural Networks
28 pages
Building A Tanh Activation Function
No ratings yet
Building A Tanh Activation Function
9 pages
1 3 Multiple Hypothesis Testing
No ratings yet
1 3 Multiple Hypothesis Testing
14 pages
Notebook - Text Classification
No ratings yet
Notebook - Text Classification
7 pages
Notebook - Music Recommendation System Reference
No ratings yet
Notebook - Music Recommendation System Reference
22 pages
Notebook - Agave Plant Maturation Model Inference and Testing
No ratings yet
Notebook - Agave Plant Maturation Model Inference and Testing
7 pages
Covariance Kernel Role in Spatial Prediction
No ratings yet
Covariance Kernel Role in Spatial Prediction
3 pages
Notebook - Geospatial
No ratings yet
Notebook - Geospatial
11 pages
Data Pipeline in ML
No ratings yet
Data Pipeline in ML
3 pages
Boston Dataset
No ratings yet
Boston Dataset
6 pages
New System To Harness 40% of The Sun's Heat To Produce Clean Hydrogen Fuel
No ratings yet
New System To Harness 40% of The Sun's Heat To Produce Clean Hydrogen Fuel
6 pages
MLS 1 - Presentation
No ratings yet
MLS 1 - Presentation
11 pages
Glossary of Notations - Recommender Systems Part 3
No ratings yet
Glossary of Notations - Recommender Systems Part 3
4 pages
5 2-6 Spatial Environmental Data Gaussian Processes
No ratings yet
5 2-6 Spatial Environmental Data Gaussian Processes
4 pages
5 3-2 Spatial Environmental Data Model Selection Long-Range Dependencies
No ratings yet
5 3-2 Spatial Environmental Data Model Selection Long-Range Dependencies
3 pages
The CNN Architecture
No ratings yet
The CNN Architecture
15 pages
ML LVC 3 Post-Session Summary
No ratings yet
ML LVC 3 Post-Session Summary
16 pages
MLS 1 - Regression
No ratings yet
MLS 1 - Regression
20 pages
ML LVC 3 Glossary
No ratings yet
ML LVC 3 Glossary
1 page
ML LVC 2 Post-Session Summary
No ratings yet
ML LVC 2 Post-Session Summary
12 pages
Klaus Filter
No ratings yet
Klaus Filter
44 pages
Leica Lens Book: Leica M System, Leica R System
100% (1)
Leica Lens Book: Leica M System, Leica R System
9 pages
Process Costing Weighted-Average Worksheet
No ratings yet
Process Costing Weighted-Average Worksheet
5 pages
CHAPTER 3 Part 4
No ratings yet
CHAPTER 3 Part 4
11 pages
Windows Processes & Registry Lab
No ratings yet
Windows Processes & Registry Lab
8 pages
Admin & Teacher Impact on NAT Performance
No ratings yet
Admin & Teacher Impact on NAT Performance
12 pages
Arnold 1998
No ratings yet
Arnold 1998
17 pages
PYTHON Khurramshahzad
No ratings yet
PYTHON Khurramshahzad
20 pages
TLV Check Valve Ckf3m
No ratings yet
TLV Check Valve Ckf3m
2 pages
Microprocessor Lecture 10
No ratings yet
Microprocessor Lecture 10
11 pages
Pre-Concept Design Report PDF
No ratings yet
Pre-Concept Design Report PDF
434 pages
BBACA 2019 Pat. SEM III CA 302 Data Structure MCQ
No ratings yet
BBACA 2019 Pat. SEM III CA 302 Data Structure MCQ
22 pages
Traffic Monitoring System
No ratings yet
Traffic Monitoring System
16 pages
Real-Life Applications of Linear Algebra
No ratings yet
Real-Life Applications of Linear Algebra
3 pages
Dot Product
No ratings yet
Dot Product
8 pages
Module 1 Highway and Railroad Engg
100% (1)
Module 1 Highway and Railroad Engg
21 pages
Automatic Light Reflector
67% (3)
Automatic Light Reflector
6 pages
OS Concepts for BSc IT Students
No ratings yet
OS Concepts for BSc IT Students
3 pages
SOT-23 Plastic-Encapsulate Transistors: Jiangsu Changjiang Electronics Technology Co., LTD
No ratings yet
SOT-23 Plastic-Encapsulate Transistors: Jiangsu Changjiang Electronics Technology Co., LTD
2 pages
Kinematics of Rectilinear Motion
No ratings yet
Kinematics of Rectilinear Motion
20 pages
Using The Swift Futura Remote Video Unit
No ratings yet
Using The Swift Futura Remote Video Unit
12 pages
Slope Stability Analysis Using FEM
No ratings yet
Slope Stability Analysis Using FEM
5 pages
Argocd
No ratings yet
Argocd
14 pages
Attachment A980727a5ed0537d
No ratings yet
Attachment A980727a5ed0537d
21 pages
NEET/JEE Chemistry Formula Guide
100% (1)
NEET/JEE Chemistry Formula Guide
18 pages
Muller Lyer Illusion
No ratings yet
Muller Lyer Illusion
8 pages
HSCH 9551 Avago
No ratings yet
HSCH 9551 Avago
2 pages
Reversible Computing
No ratings yet
Reversible Computing
2 pages
UMTS RF Troubleshooting Guide
100% (1)
UMTS RF Troubleshooting Guide
111 pages
Presentation1 (Accidental Sampling)
No ratings yet
Presentation1 (Accidental Sampling)
40 pages

Notebook - Main Code

Uploaded by

Notebook - Main Code

Uploaded by

import os

# input and output arguments

print("input data:", args.data)

# Some additional data cleaning

#For loop to do soft conversion of columns wherever possible leaving non-

#Split train and test datasets

#train_df, test_df = train_test_split(

# convert the dataframe values to array

# Extracting the label column

# convert the dataframe values to array

print(f"Training with data of shape {X_train.shape}")

# Saving the model to a file

You might also like