0% found this document useful (0 votes)

18 views10 pages

Unit-1 AI ML PYTHON - Jupyter Notebook

Uploaded by

abhimanyu.v

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

18 views10 pages

Unit-1 AI ML PYTHON - Jupyter Notebook

Uploaded by

abhimanyu.v

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 10

In [1]: 1 x=1

2 y=2.8
3 z=1j
4 print(type(x))
5 print(type(y))
6 print(type(z))

In [2]: 1 x=3+5j
2 y=5j
3 z=5j
4 print(type(x))
5 print(type(y))
6 print(type(z))

In [7]: 1 x=1
2 y=2.8
3 z=1j
4
5 a= float(x)
6 b= int(y)
7 c= complex(x)
8
9 print(a)
10 print(b)
11 print(c)
12
13 print(type(a))
14 print(type(b))
15 print(type(c))

1.0
2
(1+0j)
<class 'float'>
<class 'int'>
<class 'complex'>

27-1-2025 - PYTHON LIBRARY

#python libraries NumPy: NumPy is used for numerical operations and handling arrays.
In [5]: 1 import numpy as np
2
3 array1 = np.array([1,2,3,4])
4
5 print("NumPy Array:", array1)

NumPy Array: [1 2 3 4]

Pandas is used for data manipulation and analysis.

In [7]: 1 import pandas as pd

2
3 data = {"Name": ["Alice", "bob", "Ritika"], "Age": [25, 30, 19]}
4 df = pd.DataFrame(data)
5
6 print("DataFrame:")
7 print(df)

DataFrame:
Name Age
0 Alice 25
1 bob 30
2 Ritika 19

Matplotlib is used for data visualization

In [8]: 1 import matplotlib.pyplot as plt
2
3 x= [1, 2, 3, 4]
4 y= [10, 20, 25, 30]
5
6 plt.plot(x, y)
7 plt.title("Simple Line Graph")
8 plt.show()
In [10]: 1 import matplotlib.pyplot as plt
2
3 x= [1, 2, 3, 4, 5]
4 y= [2, 4, 6, 8, 10]
5
6 plt.plot(x, y, label="Line Plot", color="blue", marker="*")
7
8 plt.xlabel("X-Axis")
9 plt.ylabel("Y-Axis")
10 plt.title("Simple Line Graph")
11
12
13 plt.legend()
14
15 plt.show()
In [11]: 1 #data for the bar chart
2
3 categories = ['A', 'B', 'C', 'D']
4 values = [5, 7, 3, 8]
5
6 #create a bar chart
7 plt.bar(categories, values, color='orange')
8
9 #add labels and title
10
11 plt.xlabel("categories")
12 plt.ylabel("values")
13 plt.title("simple bar chart")
14
15 #display the plot
16 plt.show()

Date 28-01-2025 SCATTER PLOT EXAMPLE

In [6]: 1 import matplotlib.pyplot as plt
2 # data for the scatter plot
3 x = [1, 2, 3, 4, 5]
4 y = [5, 7, 6, 8, 9]
5
6 #create a scatter plot
7 plt.scatter(x, y, color='green', marker='x')
8
9 #add labels and titles
10 plt.xlabel("x-axis")
11 plt.ylabel("y-axis")
12 plt.title("simple scatter plot")
13
14 #display the plot
15 plt.show()

Data cleaning and Handling Missing Values

In [7]: 1 import pandas as pd
2 import numpy as np
3
4 #create a simple dataset with missing values
5 data = {
6 'Name': ['John', 'Sarah', 'Mike', 'Emma', 'David'],
7 'Age': [15, np.nan, 14, 16, np.nan], #missing values in age column
8 'Grade': ['A', 'B', 'A', 'C', 'B']
9 }
10 #convert the data into a dataframe
11 df = pd.DataFrame(data)
12
13 #print the original data
14 print("Original Data:\n", df)
15
16 #handling missing values:
17 #1. Filling missing age values with the average (mean)of the 'age' colu
18 mean_age = df['Age'].mean() #calculate mean of age column
19 df["Age"].fillna(mean_age, inplace=True)
20
21 #2. Dropping rows with missing values in 'Grade' (if any)
22 df.dropna(subset=['Grade'], inplace=True)
23
24 #print the cleaned data
25 print("\nCleaned Data (after handling missing values):\n", df)

Original Data:
Name Age Grade
0 John 15.0 A
1 Sarah NaN B
2 Mike 14.0 A
3 Emma 16.0 C
4 David NaN B

Cleaned Data (after handling missing values):

Name Age Grade
0 John 15.0 A
1 Sarah 15.0 B
2 Mike 14.0 A
3 Emma 16.0 C
4 David 15.0 B
In [1]: 1 import pandas as pd # Importing pandas library
2
3 # Step 1: Read the CSV file ('C:\Users\Preethi\Desktop\students.csv')
4 # Sample data in the CSV file:
5 # Name, Age, Grade
6 # John, 15, A
7 # Sarah, , B
8 # Mike, 14, A
9 # Emma, 16,
10 # David, , C
11
12 # Load the data into a DataFrame
13 df = pd.read_csv('C:\\Users\\ritik\\Downloads\\students1.csv')
14
15 # Step 2: Display the original data
16 print("Original Data:\n", df)
17
18 # Step 3: Data Cleaning
19 # a. Fill missing Age values with the mean of the Age column
20 df['Age'].fillna(df['Age'].mean(), inplace=True)
21
22 # b. Fill missing Grade values with a placeholder 'Not Graded'
23 df['Grade'].fillna('Not Graded', inplace=True)
24
25 # c. Check for and remove duplicate rows (if any)
26 df.drop_duplicates(inplace=True)
27
28 # Step 4: Display the cleaned data
29 print("\nCleaned Data:\n", df)

Original Data:
Name Age Grade
0 John 15.0 A
1 Janvi NaN B
2 Mike 14.0 A
3 Emma 16.0 NaN
4 kamakshr NaN C

Cleaned Data:
Name Age Grade
0 John 15.0 A
1 Janvi 15.0 B
2 Mike 14.0 A
3 Emma 16.0 Not Graded
4 kamakshr 15.0 C

Feature Scaling and Normalization

In [2]: 1 import pandas as pd
2 from sklearn.preprocessing import MinMaxScaler, StandardScaler
3
4 # Step 1: Create sample data
5 data = {'Student': ['Alice', 'Bob', 'Charlie', 'Diana'],
6 'Math_Score': [90, 45, 78, 62],
7 'Science_Score': [85, 40, 72, 65]}
8
9 # Convert to a DataFrame
10 df = pd.DataFrame(data)
11
12 # Step 2: Display original data
13 print("Original Data:\n", df)
14
15 # Step 3: Apply Min-Max Scaling
16 min_max_scaler = MinMaxScaler()
17 df[['Math_Score_Scaled', 'Science_Score_Scaled']] = min_max_scaler.fit_
18
19 # Step 4: Apply Standardization
20 standard_scaler = StandardScaler()
21 df[['Math_Score_Standardized', 'Science_Score_Standardized']] = standar
22
23 # Step 5: Display scaled and standardized data
24 print("\nData After Scaling and Standardization:\n", df)
 

Original Data:
Student Math_Score Science_Score
0 Alice 90 85
1 Bob 45 40
2 Charlie 78 72
3 Diana 62 65

Data After Scaling and Standardization:

Student Math_Score Science_Score Math_Score_Scaled \
0 Alice 90 85 1.000000
1 Bob 45 40 0.000000
2 Charlie 78 72 0.733333
3 Diana 62 65 0.377778

Science_Score_Scaled Math_Score_Standardized Science_Score_Standardiz

ed
0 1.000000 1.255031 1.1905
97
1 0.000000 -1.402682 -1.5569
34
2 0.711111 0.546308 0.3968
66
3 0.555556 -0.398657 -0.0305
28

Encoding categorical variables is a way to convert text-based data into a numerical format
that a computer can understand. For example, if we have a column for "Colors" with values
like "Red," "Blue," and "Green," we need to turn those words into numbers for machine
learning models to work with them.
In [4]: 1 #Importing the library
2 import pandas as pd
3
4 # Sample data (a small table)
5 data = {
6 'Student': ['Alice', 'Bob', 'Charlie'],
7 'Favorite Subject': ['Math', 'Science', 'Math']
8 }
9
10 # Creating a DataFrame
11 df = pd.DataFrame(data)
12
13 # Printing the original DataFrame
14 print("Original Data:")
15 print(df)
16
17 # Encoding the categorical variable (Favorite Subject)
18 df['Favorite Subject Encoded'] = df['Favorite Subject'].astype('categor
19
20 # Printing the updated DataFrame
21 print("\nData after encoding:")
22 print(df)
 

Original Data:
Student Favorite Subject
0 Alice Math
1 Bob Science
2 Charlie Math

Data after encoding:

Student Favorite Subject Favorite Subject Encoded
0 Alice Math 0
1 Bob Science 1
2 Charlie Math 0

In [ ]: 1

Manisadav
No ratings yet
Manisadav
29 pages
CSC - 310 Advanced Python Programming Continuous Assessment-2 Assignment:Ca2
No ratings yet
CSC - 310 Advanced Python Programming Continuous Assessment-2 Assignment:Ca2
33 pages
Data Science Practical Book - Ipynb
No ratings yet
Data Science Practical Book - Ipynb
21 pages
Data Preprocessing - Ipynb - Colaboratory
No ratings yet
Data Preprocessing - Ipynb - Colaboratory
7 pages
ML Lab Manual Final
No ratings yet
ML Lab Manual Final
36 pages
Practical File Questions With Answers
No ratings yet
Practical File Questions With Answers
7 pages
DA Lab Manual r22
No ratings yet
DA Lab Manual r22
31 pages
List of Practical Ip065 Xii Session 2025 CKC Academy
No ratings yet
List of Practical Ip065 Xii Session 2025 CKC Academy
19 pages
Lab File
No ratings yet
Lab File
96 pages
StudentMgmStystme ProjectFinal
100% (1)
StudentMgmStystme ProjectFinal
23 pages
Even Students
No ratings yet
Even Students
36 pages
Aiclass
No ratings yet
Aiclass
9 pages
Oddstudents
No ratings yet
Oddstudents
35 pages
Ip Practical
No ratings yet
Ip Practical
23 pages
List of Practical Ip065 Xii Session 2025 CKC Academy
No ratings yet
List of Practical Ip065 Xii Session 2025 CKC Academy
19 pages
Data Mining Lab 03
No ratings yet
Data Mining Lab 03
10 pages
Ai Tools and Applications-Lab
No ratings yet
Ai Tools and Applications-Lab
33 pages
Practical File Class Xii
No ratings yet
Practical File Class Xii
25 pages
Tung Wah College GEN3005 / GED3005 Big Data and Data Sciences
No ratings yet
Tung Wah College GEN3005 / GED3005 Big Data and Data Sciences
6 pages
DSBDA Assignment 2
No ratings yet
DSBDA Assignment 2
7 pages
Lab Manual 5 Solved 40
No ratings yet
Lab Manual 5 Solved 40
13 pages
1
No ratings yet
1
3 pages
12 Pandas
100% (1)
12 Pandas
21 pages
L-2 (Data Frame Part 1) .Ipynb - Colab
No ratings yet
L-2 (Data Frame Part 1) .Ipynb - Colab
5 pages
IP12 Gargi
No ratings yet
IP12 Gargi
32 pages
Informatics Practices Project (1) Manan
No ratings yet
Informatics Practices Project (1) Manan
21 pages
DSBDL Pract 2
No ratings yet
DSBDL Pract 2
6 pages
Info Practical
No ratings yet
Info Practical
56 pages
Python Pandas Practical Guide
No ratings yet
Python Pandas Practical Guide
111 pages
DSC Lab Programs
No ratings yet
DSC Lab Programs
24 pages
Python Pandas Assignment Guide
No ratings yet
Python Pandas Assignment Guide
9 pages
AI Practical 2025
No ratings yet
AI Practical 2025
14 pages
Lab 3 & 4
No ratings yet
Lab 3 & 4
10 pages
Code Snippets
No ratings yet
Code Snippets
7 pages
Class12 IP Practical File With Outputs
No ratings yet
Class12 IP Practical File With Outputs
8 pages
Data Analytics Lab Manual
No ratings yet
Data Analytics Lab Manual
26 pages
Data Wrangling, 2
No ratings yet
Data Wrangling, 2
4 pages
Part A Assignment - No - 1
No ratings yet
Part A Assignment - No - 1
7 pages
Sakina Assign1 Batch3
No ratings yet
Sakina Assign1 Batch3
8 pages
Info Programs Questions
No ratings yet
Info Programs Questions
18 pages
PDF&Rendition 1
No ratings yet
PDF&Rendition 1
47 pages
Abhiml ML File
No ratings yet
Abhiml ML File
74 pages
DS Practical
No ratings yet
DS Practical
30 pages
Ge Sem II Dav Upc 2344001201 Sl. No. Qp. 2012 July 2023
No ratings yet
Ge Sem II Dav Upc 2344001201 Sl. No. Qp. 2012 July 2023
16 pages
Aide Memoire Preparation Des Données
No ratings yet
Aide Memoire Preparation Des Données
2 pages
Data Science Lab Program Printout
No ratings yet
Data Science Lab Program Printout
43 pages
Data Science Practicals
No ratings yet
Data Science Practicals
47 pages
DSBDA Lab Manual24-25
No ratings yet
DSBDA Lab Manual24-25
58 pages
IP Practic MINE
No ratings yet
IP Practic MINE
30 pages
Project Work Info
No ratings yet
Project Work Info
20 pages
Data Science Practical Problems
No ratings yet
Data Science Practical Problems
40 pages
Data Cleaning
No ratings yet
Data Cleaning
22 pages
DS Manual 1
No ratings yet
DS Manual 1
96 pages
2023 Data Analysis and Visualization Using Python
100% (2)
2023 Data Analysis and Visualization Using Python
9 pages
ML-Lab05-Data Preprocessing Techniques in Python
No ratings yet
ML-Lab05-Data Preprocessing Techniques in Python
7 pages
ST Joseph'S Convent Senior Secondary School: Name:-Shatakshi Gaur Class:-Xii Sec:-A Board Roll No.
No ratings yet
ST Joseph'S Convent Senior Secondary School: Name:-Shatakshi Gaur Class:-Xii Sec:-A Board Roll No.
65 pages
Create A Pandas Series From A Dictionary of Values and An Ndarray
No ratings yet
Create A Pandas Series From A Dictionary of Values and An Ndarray
15 pages
Lab 13
No ratings yet
Lab 13
5 pages
Week 10 Resample Hourly Data
No ratings yet
Week 10 Resample Hourly Data
21 pages
Doc-20230512-Wa0008. 20231031 182924 0000
No ratings yet
Doc-20230512-Wa0008. 20231031 182924 0000
2 pages
Data Science Essentials in Python Collect Organize Explore Predict Value 1st Edition Dmitry Zinoviev
100% (1)
Data Science Essentials in Python Collect Organize Explore Predict Value 1st Edition Dmitry Zinoviev
56 pages
Data Analytics - 4 Manuscripts - Data Science For Beginners, Data Analysis With Python, SQL Computer Programming For Beginners, Statistics For Beginners
100% (1)
Data Analytics - 4 Manuscripts - Data Science For Beginners, Data Analysis With Python, SQL Computer Programming For Beginners, Statistics For Beginners
481 pages
BVM IP 2324 3papers
No ratings yet
BVM IP 2324 3papers
20 pages
Python for AI Developers
No ratings yet
Python for AI Developers
5 pages
Data Analytics Essentials Online Course
No ratings yet
Data Analytics Essentials Online Course
15 pages
55 Tarun Sentiment Analysis Reportt
No ratings yet
55 Tarun Sentiment Analysis Reportt
22 pages
Data Manipulation in Python Using Pandas
No ratings yet
Data Manipulation in Python Using Pandas
12 pages
Spam Email. Classifier
No ratings yet
Spam Email. Classifier
44 pages
FDSA Lab Manual
No ratings yet
FDSA Lab Manual
32 pages
Final R20 M.Tech AI Syllabus
No ratings yet
Final R20 M.Tech AI Syllabus
56 pages
Python Libraries & Data Visualization
No ratings yet
Python Libraries & Data Visualization
3 pages
Python For Beginners Mastering The Basics of Python - Part 1 (Alex Harrison) (Z-Library)
No ratings yet
Python For Beginners Mastering The Basics of Python - Part 1 (Alex Harrison) (Z-Library)
575 pages
Ai Class 12 Practical 2
0% (1)
Ai Class 12 Practical 2
21 pages
Data Exploration & Visualization Guide
No ratings yet
Data Exploration & Visualization Guide
42 pages
Durgesh Kumar
No ratings yet
Durgesh Kumar
2 pages
Nasreen F Resume SP
No ratings yet
Nasreen F Resume SP
1 page
Practical File (Edited) 5
No ratings yet
Practical File (Edited) 5
21 pages
Shirish Jain Resume
No ratings yet
Shirish Jain Resume
1 page
Python Data Analytics: With Pandas, NumPy, and Matplotlib, 3rd Edition Fabio Nelli Download
100% (2)
Python Data Analytics: With Pandas, NumPy, and Matplotlib, 3rd Edition Fabio Nelli Download
31 pages
Python Libraries for Finance
100% (1)
Python Libraries for Finance
15 pages
Vikash Sharma Ip Project Class 12
No ratings yet
Vikash Sharma Ip Project Class 12
27 pages
Curriclum-Syllabus-MS Data Science & MGT IIT Indore
No ratings yet
Curriclum-Syllabus-MS Data Science & MGT IIT Indore
16 pages
2 Marks Questions
No ratings yet
2 Marks Questions
116 pages
Time Sharing
No ratings yet
Time Sharing
11 pages
Numpy Pandas Exam Questions
No ratings yet
Numpy Pandas Exam Questions
2 pages
Arpit's
No ratings yet
Arpit's
1 page
Raghav's Resume
No ratings yet
Raghav's Resume
2 pages
Important Notes On Data Science
No ratings yet
Important Notes On Data Science
39 pages

Unit-1 AI ML PYTHON - Jupyter Notebook

Uploaded by

Unit-1 AI ML PYTHON - Jupyter Notebook

Uploaded by

In [1]: 1 x=1

27-1-2025 - PYTHON LIBRARY

Pandas is used for data manipulation and analysis.

In [7]: 1 import pandas as pd

Matplotlib is used for data visualization

Date 28-01-2025 SCATTER PLOT EXAMPLE

Data cleaning and Handling Missing Values

Cleaned Data (after handling missing values):

Feature Scaling and Normalization

Data After Scaling and Standardization:

Science_Score_Scaled Math_Score_Standardized Science_Score_Standardiz

Data after encoding:

You might also like