0% found this document useful (0 votes)

6 views6 pages

Pandas

The document is a comprehensive tutorial on the Pandas library for Python, covering installation, data structures, and various operations such as data manipulation, handling missing data, and visualization. It includes sections on advanced topics like pivot tables and multi-indexing. The tutorial emphasizes the importance of Pandas in data science and analysis workflows.

Uploaded by

Tom Cruise

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

6 views6 pages

Pandas

Uploaded by

Tom Cruise

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 6

📘 Pandas Tutorial: From Beginner to

Advanced

📌 Table of Contents
1. Introduction

2. Installing Pandas

3. Getting Started

4. Data Structures in Pandas

○ Series

○ DataFrame

5. Basic Operations

6. Indexing and Selecting Data

7. Handling Missing Data

8. Data Manipulation

9. GroupBy Operations

10.Merging & Joining

11.Time Series

12.Input/Output (I/O)

13.Visualization

14.Advanced Topics
15.Conclusion

🔍 1. Introduction
pandas is an open-source Python library that provides data structures and data analysis tools
for working with structured data (like Excel spreadsheets, SQL tables, CSV files, etc.).

💻 2. Installing Pandas
Install via pip:

pip install pandas

Or in Jupyter:

!pip install pandas

🚀 3. Getting Started
Import pandas:

import pandas as pd

Check version:

print(pd.__version__)

📦 4. Data Structures in Pandas

🧵 Series (1D)
s = pd.Series([1, 3, 5, None, 6, 8])
print(s)
📊 DataFrame (2D)
data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['NY', 'LA', 'Chicago']
}
df = pd.DataFrame(data)
print(df)

⚙️ 5. Basic Operations
df.head() # First 5 rows
df.tail(2) # Last 2 rows
df.shape # (rows, columns)
df.info() # Info about DataFrame
df.describe() # Statistical summary
df.columns # Column names
df.dtypes # Data types

🔍 6. Indexing and Selecting Data

df['Name'] # Select column
df[['Name', 'City']] # Multiple columns

df.loc[0] # Row by label

df.iloc[1] # Row by index
df.iloc[0:2] # Slicing rows

df[df['Age'] > 25] # Conditional filter

❓ 7. Handling Missing Data

df.isnull() # Detect missing values
df.dropna() # Drop rows with NaN
df.fillna(0) # Fill NaNs with 0
df['Age'].fillna(df['Age'].mean()) # Fill with mean
🛠️ 8. Data Manipulation
Add new column
df['Salary'] = [50000, 60000, 70000]

Rename columns
df.rename(columns={'Name': 'FullName'}, inplace=True)

Drop columns/rows
df.drop('Salary', axis=1) # Drop column
df.drop([0, 1], axis=0) # Drop rows

Sorting
df.sort_values('Age', ascending=False)

🔄 9. GroupBy Operations
grouped = df.groupby('City')
grouped['Age'].mean()

df.groupby('City').agg({'Age': 'mean', 'Salary': 'sum'})

🔗 10. Merging, Joining, Concatenating

Concatenate
pd.concat([df1, df2]) # Vertical
pd.concat([df1, df2], axis=1) # Horizontal

Merge
pd.merge(df1, df2, on='id')

Join
df1.join(df2, on='id', how='left')

⏰ 11. Time Series

dates = pd.date_range('2023-01-01', periods=6)
df = pd.DataFrame({'value': range(6)}, index=dates)

df.resample('D').sum() # Daily resample

df['2023'] # Select by year

💾 12. Input / Output (I/O)

Read files
pd.read_csv('data.csv')
pd.read_excel('data.xlsx')
pd.read_json('data.json')
pd.read_sql(query, connection)

Write files
df.to_csv('output.csv', index=False)
df.to_excel('output.xlsx')

📈 13. Visualization
Basic plotting (uses Matplotlib):

import matplotlib.pyplot as plt

df['Age'].plot(kind='hist')
df.plot(x='Name', y='Salary', kind='bar')
plt.show()
🧠 14. Advanced Topics
● Pivot Tables

df.pivot_table(values='Salary', index='City', aggfunc='mean')

● Apply functions

df['Age'].apply(lambda x: x + 1)

● Categorical data

df['City'] = df['City'].astype('category')

● MultiIndexing

df.set_index(['City', 'Name'], inplace=True)

✅ 15. Conclusion
pandas is essential for any data science or data analysis workflow. It handles:

● Data cleaning

● Transformation

● Aggregation

● Input/output

● Time-series and categorical data

Pandas Dataframe Cheat Sheet
No ratings yet
Pandas Dataframe Cheat Sheet
3 pages
Pandas Roadmap
No ratings yet
Pandas Roadmap
6 pages
Pandas Trampas
No ratings yet
Pandas Trampas
9 pages
FDS Exp4
No ratings yet
FDS Exp4
5 pages
Dataframe in Pandas - Cheatsheet
No ratings yet
Dataframe in Pandas - Cheatsheet
8 pages
Pandas For Python Pro Level Cheat Sheet
No ratings yet
Pandas For Python Pro Level Cheat Sheet
14 pages
Pandas Cheat Sheet
No ratings yet
Pandas Cheat Sheet
5 pages
Data Handling Module
No ratings yet
Data Handling Module
10 pages
Pandas
No ratings yet
Pandas
2 pages
Pandas
No ratings yet
Pandas
4 pages
Pandas
No ratings yet
Pandas
13 pages
Pandas Dataframe All Operations 1735471870
No ratings yet
Pandas Dataframe All Operations 1735471870
4 pages
Pandas Tutorial
No ratings yet
Pandas Tutorial
9 pages
Pandas Fuction Notes
No ratings yet
Pandas Fuction Notes
3 pages
Pandas Practise Problems
No ratings yet
Pandas Practise Problems
8 pages
14oct Pandas 2024
No ratings yet
14oct Pandas 2024
13 pages
Pandas Library: Data Manipulation & Analysis Guide
No ratings yet
Pandas Library: Data Manipulation & Analysis Guide
9 pages
Pandas Tutorial
No ratings yet
Pandas Tutorial
7 pages
Pandas Guide
No ratings yet
Pandas Guide
50 pages
Pandas Cheat Sheet
No ratings yet
Pandas Cheat Sheet
17 pages
Python Pandas Tutorial For Beginners
No ratings yet
Python Pandas Tutorial For Beginners
203 pages
Pandas Top 30 With Code Clean
No ratings yet
Pandas Top 30 With Code Clean
3 pages
DAP 3 Module
No ratings yet
DAP 3 Module
62 pages
Pandas Research
No ratings yet
Pandas Research
14 pages
EDA Cheat Sheet
No ratings yet
EDA Cheat Sheet
7 pages
Pandas Guide for Beginners
No ratings yet
Pandas Guide for Beginners
18 pages
Content Pandas Cheat Sheet
No ratings yet
Content Pandas Cheat Sheet
9 pages
Exploratory Data Analysis (Eda) With Pandas: (Cheatsheet)
No ratings yet
Exploratory Data Analysis (Eda) With Pandas: (Cheatsheet)
7 pages
Practical
No ratings yet
Practical
12 pages
Pandas
No ratings yet
Pandas
26 pages
Usage of NumPy For Numerical Data in Detail
No ratings yet
Usage of NumPy For Numerical Data in Detail
52 pages
Pandas Introduction: What Is Python Pandas Used For?
No ratings yet
Pandas Introduction: What Is Python Pandas Used For?
28 pages
Pandas Notes
No ratings yet
Pandas Notes
3 pages
Unit 3 (FODS)
No ratings yet
Unit 3 (FODS)
34 pages
Introduction To Pandas
No ratings yet
Introduction To Pandas
27 pages
Pandas Cheat Sheet
No ratings yet
Pandas Cheat Sheet
2 pages
Pandas
No ratings yet
Pandas
35 pages
Mypnotes
No ratings yet
Mypnotes
3 pages
Learn Pandas
No ratings yet
Learn Pandas
37 pages
Cheat Sheet - Pandas
No ratings yet
Cheat Sheet - Pandas
6 pages
Pandas Operations Guide
No ratings yet
Pandas Operations Guide
6 pages
Introduction To Pandas Programming 2
No ratings yet
Introduction To Pandas Programming 2
3 pages
05 Pandas Data Frames
No ratings yet
05 Pandas Data Frames
33 pages
Comprehensive Pandas Guide
No ratings yet
Comprehensive Pandas Guide
171 pages
Python Interviews
No ratings yet
Python Interviews
154 pages
Python Unit 3 4
No ratings yet
Python Unit 3 4
92 pages
Pandas Data Manipulation Extended CheatSheet 1731972219
No ratings yet
Pandas Data Manipulation Extended CheatSheet 1731972219
9 pages
Pandas
No ratings yet
Pandas
50 pages
FDS Module 2 Notes
No ratings yet
FDS Module 2 Notes
24 pages
Pandas
No ratings yet
Pandas
25 pages
Introduction To Pandas - Loading and Exploring Data
No ratings yet
Introduction To Pandas - Loading and Exploring Data
4 pages
Python Pandas Cheatsheety
No ratings yet
Python Pandas Cheatsheety
7 pages
Pandas Handbook
No ratings yet
Pandas Handbook
33 pages
Day 16 Serverles Computing - Lambda & Elasticbeanstalk Lab 20 - 21
No ratings yet
Day 16 Serverles Computing - Lambda & Elasticbeanstalk Lab 20 - 21
20 pages
Day 22 Route 53 and DNS
No ratings yet
Day 22 Route 53 and DNS
13 pages
Day 19 Cloudwatch & Cloudtrail Lab 24 - 25
No ratings yet
Day 19 Cloudwatch & Cloudtrail Lab 24 - 25
13 pages
Firepower Interview Questions
No ratings yet
Firepower Interview Questions
3 pages
Policies and Objects
No ratings yet
Policies and Objects
37 pages
Cisco Firepower Setup in EVE-NG Guide
No ratings yet
Cisco Firepower Setup in EVE-NG Guide
6 pages
Prepare The Palo Alto Image: .Qcow2
100% (2)
Prepare The Palo Alto Image: .Qcow2
6 pages
Cisco Nexus Switch Configuration in EVE-NG
No ratings yet
Cisco Nexus Switch Configuration in EVE-NG
6 pages
Check Point Firewall Configuration in EVE-NG
No ratings yet
Check Point Firewall Configuration in EVE-NG
4 pages
Initial Setup: Steps: Connect To The Device
No ratings yet
Initial Setup: Steps: Connect To The Device
4 pages
CV Egesarac
No ratings yet
CV Egesarac
2 pages
Dew Ansh
No ratings yet
Dew Ansh
42 pages
User's Guide For Free Pascal, Version 3.0.4 Document Version 3.0.4 September 2017
No ratings yet
User's Guide For Free Pascal, Version 3.0.4 Document Version 3.0.4 September 2017
202 pages
C# Console
100% (1)
C# Console
248 pages
AdventureWorks Entity Relationship Diagram
No ratings yet
AdventureWorks Entity Relationship Diagram
1 page
SNA Bullet 13 MCQS
No ratings yet
SNA Bullet 13 MCQS
7 pages
3 Objects and Classes
No ratings yet
3 Objects and Classes
10 pages
Verilog Quick Start - Practical Guide To Simulation & Synthesis in Verilog (3rd Ed.)
100% (2)
Verilog Quick Start - Practical Guide To Simulation & Synthesis in Verilog (3rd Ed.)
378 pages
Reappear Notice Even Sem 2025
No ratings yet
Reappear Notice Even Sem 2025
5 pages
How Much DSA Is Enough For A 4-6 LPA Job
No ratings yet
How Much DSA Is Enough For A 4-6 LPA Job
3 pages
Data Modelling and Data Models MODULE 2
100% (1)
Data Modelling and Data Models MODULE 2
47 pages
Computer Multimedia & Animation
No ratings yet
Computer Multimedia & Animation
55 pages
IT3031-Database Systems and Data-Driven Application
No ratings yet
IT3031-Database Systems and Data-Driven Application
6 pages
Lec #5 - Jquery Ajax
No ratings yet
Lec #5 - Jquery Ajax
5 pages
Q0501 Software Developer ITS - Sample Test - V1
50% (2)
Q0501 Software Developer ITS - Sample Test - V1
15 pages
Programming in Z80 Assembly Language
100% (1)
Programming in Z80 Assembly Language
129 pages
M. Tech - Dig Elo. Error Control Coding
No ratings yet
M. Tech - Dig Elo. Error Control Coding
5 pages
Os Lab Questions
No ratings yet
Os Lab Questions
7 pages
LAB#9 Vivado I
No ratings yet
LAB#9 Vivado I
15 pages
SSC-Bank MCQs Practice Set
No ratings yet
SSC-Bank MCQs Practice Set
50 pages
Unit 4-JavaBean Nodejs mongoDB
No ratings yet
Unit 4-JavaBean Nodejs mongoDB
98 pages
SV Coverage Assertions 1738667250
No ratings yet
SV Coverage Assertions 1738667250
18 pages
Theory Lecture 12 - Turing Machines
No ratings yet
Theory Lecture 12 - Turing Machines
6 pages
Jainslee Tutorial 04
100% (1)
Jainslee Tutorial 04
41 pages
Angular Course Slides
No ratings yet
Angular Course Slides
86 pages
PRACTICAL FILE OF Matlab
No ratings yet
PRACTICAL FILE OF Matlab
27 pages
B.Tech Syllabus2008-12 IT
No ratings yet
B.Tech Syllabus2008-12 IT
93 pages
QTP Sample Resume
No ratings yet
QTP Sample Resume
10 pages
Debugging by Deduction: Anum Bakhtiar
No ratings yet
Debugging by Deduction: Anum Bakhtiar
14 pages
CS Holiday Homework
No ratings yet
CS Holiday Homework
71 pages

Pandas

Uploaded by

Pandas

Uploaded by

📘 Pandas Tutorial: From Beginner to

2.​ Installing Pandas​

3.​ Getting Started​

4.​ Data Structures in Pandas​

5.​ Basic Operations​

6.​ Indexing and Selecting Data​

7.​ Handling Missing Data​

8.​ Data Manipulation​

9.​ GroupBy Operations​

10.​Merging & Joining​

pip install pandas

!pip install pandas

📦 4. Data Structures in Pandas

🔍 6. Indexing and Selecting Data

df.loc[0] # Row by label

df[df['Age'] > 25] # Conditional filter

❓ 7. Handling Missing Data

df.groupby('City').agg({'Age': 'mean', 'Salary': 'sum'})

🔗 10. Merging, Joining, Concatenating

⏰ 11. Time Series

df.resample('D').sum() # Daily resample

💾 12. Input / Output (I/O)

import matplotlib.pyplot as plt

df.pivot_table(values='Salary', index='City', aggfunc='mean')

df.set_index(['City', 'Name'], inplace=True)

●​ Time-series and categorical data​

You might also like

2. Installing Pandas

3. Getting Started

4. Data Structures in Pandas

5. Basic Operations

6. Indexing and Selecting Data

7. Handling Missing Data

8. Data Manipulation

9. GroupBy Operations

10.Merging & Joining

● Time-series and categorical data