0% found this document useful (0 votes)

35 views5 pages

L-2 (Data Frame Part 1) .Ipynb - Colab

The document is a Jupyter notebook that demonstrates basic operations on data frames using Python's pandas library. It covers importing data, renaming columns, finding smallest and largest values, filtering data, and performing statistical functions like mean, median, mode, and standard deviation. Additionally, it includes examples of cumulative sums and products, as well as correlation and covariance calculations.

Uploaded by

ashishpal2804

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

35 views5 pages

L-2 (Data Frame Part 1) .Ipynb - Colab

Uploaded by

ashishpal2804

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 5

3/14/25, 4:35 PM L-2 (Data Frame Part 1).

ipynb - Colab

keyboard_arrow_down Python Data Frames Part 1

Basic Operations on Data

# import libraries
import numpy as np
import pandas as pd

from google.colab import drive

drive.mount('/content/drive', force_remount=True)
marks = pd.read_csv("/content/drive/MyDrive/Data_Analytics/Test_data.csv")
print(marks)

Mounted at /content/drive
RollNo Name Eco Maths
0 1 Arnab 18 57
1 2 Kritika 23 45
2 3 Divyam 51 37
3 4 Vivaan 40 60
4 5 Aaaroosh 18 27

marks.columns=['ROLLNO', 'NAME', 'ECONOMICS', 'MATHS'] # Renaming of Column

marks

ROLLNO NAME ECONOMICS MATHS

0 1 Arnab 18 57

1 2 Kritika 23 45

2 3 Divyam 51 37

3 4 Vivaan 40 60

4 5 Aaaroosh 18 27
 

# nsmallest(n, column_label) gives the n smallest values in the column, creates a dataframe as its result
least2 = marks.nsmallest(2, "ECONOMICS")
print(least2)

ROLLNO NAME ECONOMICS MATHS

0 1 Arnab 18 57
4 5 Aaaroosh 18 27

# nlargest(n, column_label) gives the n largest values in the column, creates a dataframe as its result
great2 = marks.nlargest(2, "MATHS")
print(great2)

ROLLNO NAME ECONOMICS MATHS

3 4 Vivaan 40 60
0 1 Arnab 18 57

# between checks for values in a range

result = marks["MATHS"].between(35, 45, "both")
print(marks[result]) # Filtering the dataframe on a boolean series

ROLLNO NAME ECONOMICS MATHS

1 2 Kritika 23 45
2 3 Divyam 51 37

print(result)
print(type(result))

0 False
1 True
2 True
3 False
4 False
Name: Maths, dtype: bool
<class 'pandas.core.series.Series'>

datadic = {"P":[2, 9, 8, 7],

"Q":[1, 20, 12, 5],
"R":[14, 30, 18, 52],
"S":[52, 46, 12, 83]}
df = pd.DataFrame(datadic)
df
https://colab.research.google.com/drive/1Bos1V9K5-scUxXEBk7rNViiSpMC4k0wJ#scrollTo=A6cdItmM9Kkg&printMode=true 1/5
3/14/25, 4:35 PM L-2 (Data Frame Part 1).ipynb - Colab

P Q R S

0 2 1 14 52

1 9 20 30 46

2 8 12 18 12

3 7 5 52 83
 

count = df['P'].count()
print(count)

max_val=df['P'].max()
print ("Maximum Value of one Column P\n", max_val)
max_row=df.max(axis=1)
print ("Maximum Value Rowwise\n", max_row)
max_col=df.max(axis=0)
print ("Maximum Value Columnwise\n", max_col)

Maximum Value of one Column P

9
Maximum Value Rowwise
0 52
1 46
2 18
3 83
dtype: int64
Maximum Value Columnwise
P 9
Q 20
R 52
S 83
dtype: int64

min_val=df['P'].min()
print ("Minimum Value of one Column P\n", min_val)
min_row=df.min(axis=1)
print ("Minimum Value Rowwise\n", min_row)
min_col=df.min(axis=0)
print ("Minimum Value Columnwise\n", min_col)

Minimum Value of one Column P

2
Minimum Value Rowwise
0 1
1 9
2 8
3 5
dtype: int64
Minimum Value Columnwise
P 2
Q 1
R 14
S 12
dtype: int64

Basic Statistical Functions

mean_val=df['P'].mean()
print ("Mean Value of one Column P\n", mean_val)
mean_row=df.mean(axis=1)
print ("Mean Value Rowwise\n", mean_row)
mean_col=df.mean(axis=0)
print ("Mean Value Columnwise\n", mean_col)

Mean Value of one Column P

6.5
Mean Value Rowwise
0 17.25
1 26.25
2 12.50
3 36.75
dtype: float64
Mean Value Columnwise
P 6.50
Q 9.50
R 28.50
S 48.25

https://colab.research.google.com/drive/1Bos1V9K5-scUxXEBk7rNViiSpMC4k0wJ#scrollTo=A6cdItmM9Kkg&printMode=true 2/5
3/14/25, 4:35 PM L-2 (Data Frame Part 1).ipynb - Colab
dtype: float64

# mean() function on a dataframe which has Na values.

df = pd.DataFrame({"Anu":[12, 4, 5, None, 1], "Bina":[7, 2, 54, 3, None],
"Chitra":[20, 16, 11, 3, 8], "Deep":[14, 3, None, 2, 6]})
print(df)
# skip the Na values while finding the mean
df.mean(axis = 1, skipna = True) # Mean over the column axis.

Anu Bina Chitra Deep

0 12.0 7.0 20 14.0
1 4.0 2.0 16 3.0
2 5.0 54.0 11 NaN
3 NaN 3.0 3 2.0
4 1.0 NaN 8 6.0
0 13.250000
1 6.250000
2 23.333333
3 2.666667
4 5.000000
dtype: float64

mode_val=df['P'].mode()
print ("Mode Value of one Column P\n", mode_val)
mode_row=df.mode(axis=1)
print ("Mode Value Rowwise\n", mode_row)
mode_col=df.mode(axis=0)
print ("Mode Value Columnwise\n", mode_col)

Mode Value of one Column P

0 2
1 7
2 8
3 9
Name: P, dtype: int64
Mode Value Rowwise
0 1 2 3
0 1.0 2.0 14.0 52.0
1 9.0 20.0 30.0 46.0
2 12.0 NaN NaN NaN
3 5.0 7.0 52.0 83.0
Mode Value Columnwise
P Q R S
0 2 1 14 12
1 7 5 18 46
2 8 12 30 52
3 9 20 52 83

median_val=df['P'].median()
print ("Median Value of one Column P\n", median_val)
median_row=df.median(axis=1)
print ("Median Value Rowwise\n", median_row)
median_col=df.median(axis=0)
print ("Median Value Columnwise\n", median_col)

Median Value of one Column P

7.5
Median Value Rowwise
0 8.0
1 25.0
2 12.0
3 29.5
dtype: float64
Median Value Columnwise
P 7.5
Q 8.5
R 24.0
S 49.0
dtype: float64

std_val=df['P'].std()
print ("Standard Deviation Value of one Column P\n",
std_val)
std_row=df.std(axis=1)
print ("Standard Deviation Value Rowwise\n", std_row)
std_col=df.std(axis=0)
print ("Standard Deviation Value Columnwise\n", std_col)

Standard Deviation Value of one Column P

3.1091263510296048
Standard Deviation Value Rowwise
0 23.907809
1 15.713582
2 4.123106

https://colab.research.google.com/drive/1Bos1V9K5-scUxXEBk7rNViiSpMC4k0wJ#scrollTo=A6cdItmM9Kkg&printMode=true 3/5
3/14/25, 4:35 PM L-2 (Data Frame Part 1).ipynb - Colab
3 37.703890
dtype: float64
Standard Deviation Value Columnwise
P 3.109126
Q 8.346656
R 17.078251
S 29.101833
dtype: float64

print(df.cov())

P Q R S
P 9.666667 22.000000 21.666667 -19.833333
Q 22.000000 69.666667 2.333333 -100.833333
R 21.666667 2.333333 291.666667 379.833333
S -19.833333 -100.833333 379.833333 846.916667

df['P'].cov(df['Q']) # Correlation between two specific columns

print(df.corr())

P Q R S
P 1.000000 0.847758 0.408047 -0.219198
Q 0.847758 1.000000 0.016369 -0.415118
R 0.408047 0.016369 1.000000 0.764239
S -0.219198 -0.415118 0.764239 1.000000

df['P'].corr(df['Q']) # Correlation between two specific columns

print(df)
print(df.cumsum(axis=0))

P Q R S
0 2 1 14 52
1 9 20 30 46
2 8 12 18 12
3 7 5 52 83
P Q R S
0 2 1 14 52
1 11 21 44 98
2 19 33 62 110
3 26 38 114 193

print(df)
print(df.cumsum(axis=1))

P Q R S
0 2 1 14 52
1 9 20 30 46
2 8 12 18 12
3 7 5 52 83
P Q R S
0 2 3 17 69
1 9 29 59 105
2 8 20 38 50
3 7 12 64 147

print(df)
print(df.cumprod(axis=0))

P Q R S
0 2 1 14 52
1 9 20 30 46
2 8 12 18 12
3 7 5 52 83
P Q R S
0 2 1 14 52
1 18 20 420 2392
2 144 240 7560 28704
3 1008 1200 393120 2382432

https://colab.research.google.com/drive/1Bos1V9K5-scUxXEBk7rNViiSpMC4k0wJ#scrollTo=A6cdItmM9Kkg&printMode=true 4/5
3/14/25, 4:35 PM L-2 (Data Frame Part 1).ipynb - Colab

https://colab.research.google.com/drive/1Bos1V9K5-scUxXEBk7rNViiSpMC4k0wJ#scrollTo=A6cdItmM9Kkg&printMode=true 5/5

Numpy Dataframe
No ratings yet
Numpy Dataframe
12 pages
Pandas Series & DataFrame Guide
No ratings yet
Pandas Series & DataFrame Guide
60 pages
Ge Sem II Dav Upc 2344001201 Sl. No. Qp. 2012 July 2023
No ratings yet
Ge Sem II Dav Upc 2344001201 Sl. No. Qp. 2012 July 2023
16 pages
DAV Previous Year
No ratings yet
DAV Previous Year
7 pages
Vanshika Goyal Gec Practicals
No ratings yet
Vanshika Goyal Gec Practicals
31 pages
Ip Project Work 2
No ratings yet
Ip Project Work 2
52 pages
Python For Data Analysis Jan 28
No ratings yet
Python For Data Analysis Jan 28
105 pages
Ap Python
No ratings yet
Ap Python
12 pages
DSC Lab Programs
No ratings yet
DSC Lab Programs
24 pages
Dav 2024 Pyq
No ratings yet
Dav 2024 Pyq
7 pages
Data Analysis Exam for CS Majors
No ratings yet
Data Analysis Exam for CS Majors
12 pages
PYQ Data Analysis and Visualisation Using Python GE May 2024
No ratings yet
PYQ Data Analysis and Visualisation Using Python GE May 2024
6 pages
Cs Sem III Dav Upc 2343012002 Sl. No. Qp. 1673 Dec '23
No ratings yet
Cs Sem III Dav Upc 2343012002 Sl. No. Qp. 1673 Dec '23
12 pages
Wa0012.
No ratings yet
Wa0012.
30 pages
14-06-2025 Cbse Ip Term-1 Scheme of Valution
No ratings yet
14-06-2025 Cbse Ip Term-1 Scheme of Valution
5 pages
Info Practical
No ratings yet
Info Practical
56 pages
Ip Project
No ratings yet
Ip Project
27 pages
CSC - 310 Advanced Python Programming Continuous Assessment-2 Assignment:Ca2
No ratings yet
CSC - 310 Advanced Python Programming Continuous Assessment-2 Assignment:Ca2
33 pages
Ip Study
No ratings yet
Ip Study
18 pages
GE Python Visualization 2023
No ratings yet
GE Python Visualization 2023
16 pages
Davp Pyq 2023 Solution
No ratings yet
Davp Pyq 2023 Solution
15 pages
12 Pandas
No ratings yet
12 Pandas
9 pages
Pandas Data Handling & Visualization Guide
100% (1)
Pandas Data Handling & Visualization Guide
37 pages
Even Students
No ratings yet
Even Students
36 pages
2023 Data Analysis and Visualization Using Python
100% (2)
2023 Data Analysis and Visualization Using Python
9 pages
Data Analysis with Pandas
No ratings yet
Data Analysis with Pandas
31 pages
Pandas
No ratings yet
Pandas
5 pages
GE - Computer Scien EaQvs42
No ratings yet
GE - Computer Scien EaQvs42
6 pages
Practical File Questions With Answers
No ratings yet
Practical File Questions With Answers
7 pages
Gec Practicals
No ratings yet
Gec Practicals
31 pages
QP - Ip PB19-01QP
No ratings yet
QP - Ip PB19-01QP
7 pages
Revision Notes DataFrame XII IP
No ratings yet
Revision Notes DataFrame XII IP
8 pages
DP Prog
No ratings yet
DP Prog
10 pages
Python For Statistics
No ratings yet
Python For Statistics
40 pages
Data Science Cheat Sheet: KEY Imports
100% (1)
Data Science Cheat Sheet: KEY Imports
1 page
Python Cheat Sheet: Pandas - Numpy - Sklearn Matplotlib - Seaborn BS4 - Selenium - Scrapy
100% (3)
Python Cheat Sheet: Pandas - Numpy - Sklearn Matplotlib - Seaborn BS4 - Selenium - Scrapy
9 pages
Ge - Computer Science Data Analysis
No ratings yet
Ge - Computer Science Data Analysis
16 pages
Data Science Practical Book - Ipynb
No ratings yet
Data Science Practical Book - Ipynb
21 pages
Chapter 2 - Python Pandas II
No ratings yet
Chapter 2 - Python Pandas II
71 pages
Python Data Analysis Basics
No ratings yet
Python Data Analysis Basics
32 pages
DAV Practicle File
No ratings yet
DAV Practicle File
28 pages
Term 1 IP AK
No ratings yet
Term 1 IP AK
6 pages
Data Science Practicals
No ratings yet
Data Science Practicals
47 pages
DAV Practical
No ratings yet
DAV Practical
12 pages
Ip 2019
No ratings yet
Ip 2019
12 pages
QP - Info - Gr.12 - June MT - 2022 - MS
No ratings yet
QP - Info - Gr.12 - June MT - 2022 - MS
15 pages
Pandas DataFrame Notes
100% (1)
Pandas DataFrame Notes
10 pages
Unit 1 Python Pandas
No ratings yet
Unit 1 Python Pandas
20 pages
Practical 1 and 2-1
No ratings yet
Practical 1 and 2-1
33 pages
FDS Ii Ans Key PDF
No ratings yet
FDS Ii Ans Key PDF
50 pages
Revision - Data Frames
No ratings yet
Revision - Data Frames
6 pages
DS Manual 1
No ratings yet
DS Manual 1
96 pages
IP Practic MINE
No ratings yet
IP Practic MINE
30 pages
DXE 24gksmknvj
No ratings yet
DXE 24gksmknvj
16 pages
UNIT-4 Important Q-A
No ratings yet
UNIT-4 Important Q-A
28 pages
23bet10114 Naman Gupta Assignment-1
No ratings yet
23bet10114 Naman Gupta Assignment-1
17 pages
Python Pandas - 2 2020-21
No ratings yet
Python Pandas - 2 2020-21
21 pages
Data Analysis & Visualization
No ratings yet
Data Analysis & Visualization
26 pages
Flow Passed Immersed Bodies: Outline
No ratings yet
Flow Passed Immersed Bodies: Outline
22 pages
Quiz-2 Along With Solution
No ratings yet
Quiz-2 Along With Solution
2 pages
Digital Distance Relay Modeling and Testing Using LabVIEW and MATLAB Simulink
No ratings yet
Digital Distance Relay Modeling and Testing Using LabVIEW and MATLAB Simulink
55 pages
Q3 - WS - Mathematics 7 - Lesson 3 - Week 3
No ratings yet
Q3 - WS - Mathematics 7 - Lesson 3 - Week 3
12 pages
2403.19608v1.classical Kerr Schild Double Copy in Bigravity For Maximally Symmetric Spacetimes
No ratings yet
2403.19608v1.classical Kerr Schild Double Copy in Bigravity For Maximally Symmetric Spacetimes
35 pages
Integrity Assessment of Bucket Wheel Excavator Welded Structures by Using The Single Selection Method
No ratings yet
Integrity Assessment of Bucket Wheel Excavator Welded Structures by Using The Single Selection Method
6 pages
Fibonacci Recrsion Javascript
No ratings yet
Fibonacci Recrsion Javascript
1 page
Dimanal 2 Sols
No ratings yet
Dimanal 2 Sols
4 pages
Errors Theory (1-108)
No ratings yet
Errors Theory (1-108)
108 pages
Realism and Objectivism in Quantum Mechanics Vassilios Karakostas
No ratings yet
Realism and Objectivism in Quantum Mechanics Vassilios Karakostas
20 pages
Heer and Maussner PP 28-41
No ratings yet
Heer and Maussner PP 28-41
14 pages
X Project Topics
No ratings yet
X Project Topics
1 page
Kinematics
No ratings yet
Kinematics
3 pages
Maximum Mark: 96: Cambridge International General Certificate of Secondary Education (9-1)
No ratings yet
Maximum Mark: 96: Cambridge International General Certificate of Secondary Education (9-1)
8 pages
DAM Class 21-24 Regression Analysis
No ratings yet
DAM Class 21-24 Regression Analysis
93 pages
Lab 6
No ratings yet
Lab 6
12 pages
2006 Int ANSYS Conf 180 PDF
No ratings yet
2006 Int ANSYS Conf 180 PDF
21 pages
Precalculus Mathematics for Calculus 7th Edition Test Bank
No ratings yet
Precalculus Mathematics for Calculus 7th Edition Test Bank
40 pages
TC HKMO 0405 H GP
No ratings yet
TC HKMO 0405 H GP
3 pages
Life Table Analysis and Insurance
No ratings yet
Life Table Analysis and Insurance
2 pages
Skills Builder 8 Workbook Answers: Integers, Powers and Roots
100% (2)
Skills Builder 8 Workbook Answers: Integers, Powers and Roots
26 pages
Basic Statistics Solutions Guide
No ratings yet
Basic Statistics Solutions Guide
3 pages
Discrete Math Final Review
No ratings yet
Discrete Math Final Review
58 pages
Two Way Slab Punching Shear Check
No ratings yet
Two Way Slab Punching Shear Check
1 page
Calculus Powerpoint
No ratings yet
Calculus Powerpoint
30 pages
Case Processing Summary
No ratings yet
Case Processing Summary
2 pages
DM Endsem
No ratings yet
DM Endsem
14 pages
Chapter 3 - Linked List
No ratings yet
Chapter 3 - Linked List
22 pages
Dulwich Year 7 Maths Specimen Paper e
No ratings yet
Dulwich Year 7 Maths Specimen Paper e
15 pages
Dickens Hard Times 1854
No ratings yet
Dickens Hard Times 1854
280 pages

L-2 (Data Frame Part 1) .Ipynb - Colab

Uploaded by

L-2 (Data Frame Part 1) .Ipynb - Colab

Uploaded by

3/14/25, 4:35 PM L-2 (Data Frame Part 1).

keyboard_arrow_down Python Data Frames Part 1

from google.colab import drive

marks.columns=['ROLLNO', 'NAME', 'ECONOMICS', 'MATHS'] # Renaming of Column

ROLLNO NAME ECONOMICS MATHS

ROLLNO NAME ECONOMICS MATHS

ROLLNO NAME ECONOMICS MATHS

# between checks for values in a range

ROLLNO NAME ECONOMICS MATHS

datadic = {"P":[2, 9, 8, 7],

Maximum Value of one Column P

Minimum Value of one Column P

Basic Statistical Functions

Mean Value of one Column P

# mean() function on a dataframe which has Na values.

Anu Bina Chitra Deep

Mode Value of one Column P

Median Value of one Column P

Standard Deviation Value of one Column P

df['P'].cov(df['Q']) # Correlation between two specific columns

df['P'].corr(df['Q']) # Correlation between two specific columns

You might also like