Pandas Cheat Sheet

The document provides a comprehensive overview of various pandas functions for data manipulation and analysis in Python. It includes methods for reading and writing data, accessing and filtering DataFrames, handling missing values, sorting, grouping, merging, and performing statistical operations. Additionally, it covers visualization techniques using pandas plotting capabilities.

Uploaded by

mohammedzuheb

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

13 views11 pages

Pandas Cheat Sheet

Uploaded by

mohammedzuheb

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 11

Tajamul Khan

@Tajamulkhann
pd.read_csv(filename): Read data from a
CSV file.
pd.read_table(filename): Read data from
a delimited text file.
pd.read_excel(filename): Read data from
an Excel file.
pd.read_sql(query, connection_object):
Read data from a SQL table/database.
pd.read_json(json_string): Read data
from a JSON formatted string, URL, or
file.
pd.read_html(url): Parse an HTML URL,
string, or file to extract tables to a
list of DataFrames.
pd.DataFrame(dict): Create a DataFrame
from a dictionary (keys as column
names, values as lists).
df.to_csv(filename): Write to a CSV
file.
df.to_excel(filename): Write to an
Excel file.
df.to_sql(table_nm, connection_object):
Write to a SQL table.
df.to_json(filename): Write to a file
in JSON format.

@Tajamulkhann
df.head(): View the first 5 rows
of the DataFrame.
df.tail(): View the last 5 rows
of the DataFrame.
df.sample(): View the random 5
rows of the DataFrame.
df.shape: Get the dimensions of
the DataFrame.
df.info(): Get a concise summary
of the DataFrame.
df.describe(): Summary
statistics for numerical
columns.
df.dtypes: Check data types of
columns.
df.columns: List column names.
df.index: Display the index
range.

@Tajamulkhann
df['column']: Select a single
column.
df[['col1', 'col2']]: Select
multiple columns.
df.iloc[0]: Select the first row
by position.
df.loc[0]: Select the first row
by index label.
df.iloc[0, 0]: Select a specific
element by position.
df.loc[0, 'column']: Select a
specific element by label.
df[df['col'] > 5]: Filter rows
where column > 5.
df.iloc[0:5, 0:2]: Slice rows
and columns.
df.set_index('column'): Set a
column as the index.

@Tajamulkhann
df.isnull(): Check for null
values.
df.notnull(): Check for non-null
values.
df.dropna(): Drop rows with null
values.
df.fillna(value): Replace null
values with a specific value.
df.replace(1, 'one'): Replace
specific values.
df.rename(columns={'old':
'new'}): Rename columns.
df.astype('int'): Change data
type of a column.
df.drop_duplicates(): Remove
duplicate rows.
df.reset_index(): Reset the
index.

@Tajamulkhann
df.sort_values('col'): Sort by
column in ascending order.
df.sort_values('col',
ascending=False): Sort by column
in descending order.
df.sort_values(['col1', 'col2'],
ascending=[True, False]): Sort
by multiple columns.
df[df['col'] > 5]: Filter rows
based on condition.
df.query('col > 5'): Filter
using a query string.
df.sample(5): Randomly select 5
rows.
df.nlargest(3, 'col'): Get top 3
rows by column.
df.nsmallest(3, 'col'): Get
bottom 3 rows by column.
df.filter(like='part'): Filter
columns by substring.

@Tajamulkhann
df.groupby('col'): Group by a
column.
df.groupby('col').mean(): Mean
of groups.
df.groupby('col').sum(): Sum of
groups.
df.groupby('col').count(): Count
non-null values in groups.
df.groupby('col')
['other_col'].max(): Max value
in another column for groups.
df.pivot_table(values='col',
index='group', aggfunc='mean'):
Create a pivot table.
df.agg({'col1': 'mean', 'col2':
'sum'}): Aggregate multiple
columns.
df.apply(np.mean): Apply a
function to columns.
df.transform(lambda x: x + 10):
Transform data column-wise.

@Tajamulkhann
pd.concat([df1, df2]):
Concatenate DataFrames
vertically.
pd.concat([df1, df2], axis=1):
Concatenate DataFrames
horizontally.
df1.merge(df2, on='key'): Merge
two DataFrames on a key.
df1.join(df2): SQL-style join.
df1.append(df2): Append rows of
one DataFrame to another.
pd.merge(df1, df2, how='outer',
on='key'): Outer join.
pd.merge(df1, df2, how='inner',
on='key'): Inner join.
pd.merge(df1, df2, how='left',
on='key'): Left join.
pd.merge(df1, df2, how='right',
on='key'): Right join.

@Tajamulkhann
df.mean(): Column-wise mean.
df.median(): Column-wise
median.
df.std(): Column-wise standard
deviation.
df.var(): Column-wise
variance.
df.sum(): Column-wise sum.
df.min(): Column-wise minimum.
df.max(): Column-wise maximum.
df.count(): Count of non-null
values per column.
df.corr(): Correlation matrix.

@Tajamulkhann
df.plot(kind='line'): Line
plot.
df.plot(kind='bar'): Vertical
bar plot.
df.plot(kind='barh'):
Horizontal bar plot.
df.plot(kind='hist'):
Histogram.
df.plot(kind='box'): Box
plot.
df.plot(kind='kde'): Kernel
density estimation plot.
df.plot(kind='pie', y='col'):
Pie chart.
df.plot.scatter(x='c1',
y='c2'): Scatter plot.
df.plot(kind='area'): Area
plot.

@Tajamulkhann
Follow for more!

Pandas Cheat Sheet Serves
No ratings yet
Pandas Cheat Sheet Serves
20 pages
Imp Pandas Cheatsheet
No ratings yet
Imp Pandas Cheatsheet
11 pages
Pandas Cheatsheet
No ratings yet
Pandas Cheatsheet
10 pages
Pandas Cheat Sheet PDF
67% (3)
Pandas Cheat Sheet PDF
1 page
Python Cheat Sheet Code Academy
100% (1)
Python Cheat Sheet Code Academy
1 page
Data Science Cheat Sheet: KEY Imports
100% (1)
Data Science Cheat Sheet: KEY Imports
1 page
Pandas Cheat Sheet for Data Science
No ratings yet
Pandas Cheat Sheet for Data Science
5 pages
Pandas Cheatsheet
No ratings yet
Pandas Cheatsheet
11 pages
Pandas Cheatsheet 1743309413
No ratings yet
Pandas Cheatsheet 1743309413
11 pages
Pandas Operations Guide
No ratings yet
Pandas Operations Guide
6 pages
Pandas Dataframe Cheat Sheet
No ratings yet
Pandas Dataframe Cheat Sheet
3 pages
EDS - Python Cheat Sheet
0% (1)
EDS - Python Cheat Sheet
3 pages
Pandas PDF
No ratings yet
Pandas PDF
25 pages
Pandas Cheatsheet
No ratings yet
Pandas Cheatsheet
1 page
Pandas Cheat Sheet Free Resources At: Dataquest - Io/guide
No ratings yet
Pandas Cheat Sheet Free Resources At: Dataquest - Io/guide
7 pages
Pandas Commands
No ratings yet
Pandas Commands
3 pages
Introduction To Pandas
No ratings yet
Introduction To Pandas
27 pages
Pandas
No ratings yet
Pandas
13 pages
SQL Cheat Sheet Python
100% (1)
SQL Cheat Sheet Python
1 page
Python For DS Cheat Sheet
100% (2)
Python For DS Cheat Sheet
6 pages
7.2 - Data Frame Basics - mp4
No ratings yet
7.2 - Data Frame Basics - mp4
3 pages
Pandas Guide
No ratings yet
Pandas Guide
50 pages
Pandas Data Manipulation Extended CheatSheet 1731972219
No ratings yet
Pandas Data Manipulation Extended CheatSheet 1731972219
9 pages
Commands SQL, Python (BASICS)
No ratings yet
Commands SQL, Python (BASICS)
7 pages
Chapter Notes - Data Handling Using Pandas DataFrame
No ratings yet
Chapter Notes - Data Handling Using Pandas DataFrame
16 pages
Pyspark Cheatsheet
No ratings yet
Pyspark Cheatsheet
10 pages
Pandas
No ratings yet
Pandas
5 pages
Cheat Sheet: Python For Data Science
No ratings yet
Cheat Sheet: Python For Data Science
1 page
Pandas Essentials for Data Scientists
No ratings yet
Pandas Essentials for Data Scientists
22 pages
Pandas DataFrame Notes
No ratings yet
Pandas DataFrame Notes
13 pages
05 Pandas Data Frames
No ratings yet
05 Pandas Data Frames
33 pages
Ainotes
No ratings yet
Ainotes
5 pages
PYTHON Pandas and Manipulation Data
No ratings yet
PYTHON Pandas and Manipulation Data
36 pages
Pandas Notes Design
No ratings yet
Pandas Notes Design
5 pages
Ainotes Dataframe
No ratings yet
Ainotes Dataframe
5 pages
Pandas Library
No ratings yet
Pandas Library
6 pages
Pandas Data Wrangling Cheat Sheet
100% (2)
Pandas Data Wrangling Cheat Sheet
6 pages
3Y3Z2Xzqn7 U Y%K : 2. How To Create A Data Frame Using A Dictionary of Pre-Existing Columns or Numpy 2D Arrays?
No ratings yet
3Y3Z2Xzqn7 U Y%K : 2. How To Create A Data Frame Using A Dictionary of Pre-Existing Columns or Numpy 2D Arrays?
8 pages
Data Aggregation and Group Operations
No ratings yet
Data Aggregation and Group Operations
34 pages
Pandas 1705297450
No ratings yet
Pandas 1705297450
21 pages
Pandas Library: Data Manipulation & Analysis Guide
No ratings yet
Pandas Library: Data Manipulation & Analysis Guide
9 pages
Data Frame
No ratings yet
Data Frame
95 pages
Pyspark Cheatsheet
No ratings yet
Pyspark Cheatsheet
21 pages
Pandas DataFrame Notes
100% (1)
Pandas DataFrame Notes
10 pages
Python CheatSheet
No ratings yet
Python CheatSheet
2 pages
Unit - 4 - Part 2
No ratings yet
Unit - 4 - Part 2
36 pages
Interactive Data Analysis With Jupyter Cheatsheet 1731972443
No ratings yet
Interactive Data Analysis With Jupyter Cheatsheet 1731972443
10 pages
DataFrame Basics in Data Analytics
No ratings yet
DataFrame Basics in Data Analytics
9 pages
Fundamental - Python
No ratings yet
Fundamental - Python
3 pages
Manipulating Dataframes - Beginner
No ratings yet
Manipulating Dataframes - Beginner
2 pages
File Ip
No ratings yet
File Ip
22 pages
NARAYANA e
No ratings yet
NARAYANA e
19 pages
Access Test
No ratings yet
Access Test
8 pages
Unit 8 DBMS
No ratings yet
Unit 8 DBMS
82 pages
FastGeo Efficient Geometric Range Queries
No ratings yet
FastGeo Efficient Geometric Range Queries
5 pages
Training Assignments: Java Se 8 Programming Language
No ratings yet
Training Assignments: Java Se 8 Programming Language
6 pages
CS621 Assignment 01
No ratings yet
CS621 Assignment 01
2 pages
CCS341 Data Warehousing Unit 2 Notes - Ccs341-Data-warehousing-unit-2-Notes
No ratings yet
CCS341 Data Warehousing Unit 2 Notes - Ccs341-Data-warehousing-unit-2-Notes
32 pages
WRKQRY Query Definition
No ratings yet
WRKQRY Query Definition
3 pages
Eztrieve Presentation
No ratings yet
Eztrieve Presentation
60 pages
Linq Revision
No ratings yet
Linq Revision
22 pages
SEO-Optimized Resume for Bioinformatics Expert
No ratings yet
SEO-Optimized Resume for Bioinformatics Expert
4 pages
HBase and NoSQL Overview
No ratings yet
HBase and NoSQL Overview
14 pages
Pega Final Topics
No ratings yet
Pega Final Topics
11 pages
Normalization Airlines
No ratings yet
Normalization Airlines
5 pages
Azure Data Factory Mapping Data Flows
No ratings yet
Azure Data Factory Mapping Data Flows
22 pages
Localhost / Poskopil - OPS MANTAP PRAJA 2018 - phpMyAdmin 4.7.3
No ratings yet
Localhost / Poskopil - OPS MANTAP PRAJA 2018 - phpMyAdmin 4.7.3
1 page
System Design Interviews - A Step by Step Guide - Grokking The System Design Interview
No ratings yet
System Design Interviews - A Step by Step Guide - Grokking The System Design Interview
7 pages
Class Xii CS Pre Board QP
No ratings yet
Class Xii CS Pre Board QP
9 pages
3 Eer 05 01 2024
No ratings yet
3 Eer 05 01 2024
38 pages
MySQL Perf Tuning OOW2015 Dim
No ratings yet
MySQL Perf Tuning OOW2015 Dim
141 pages
Applied ADO NET Building Data Driven Solutions 1st Edition Mahesh Chand Instant Download
100% (3)
Applied ADO NET Building Data Driven Solutions 1st Edition Mahesh Chand Instant Download
73 pages
1Mcq Questions
No ratings yet
1Mcq Questions
3 pages
SAP & ERP Essentials for Businesses
No ratings yet
SAP & ERP Essentials for Businesses
49 pages
DP 300
No ratings yet
DP 300
13 pages
DW Life Cycle
No ratings yet
DW Life Cycle
114 pages
Database Design for Attendance System
No ratings yet
Database Design for Attendance System
10 pages
10 Tips Every XenDesktop Admin Should Know
No ratings yet
10 Tips Every XenDesktop Admin Should Know
84 pages
Lecture 1 Addition What Is Data?
No ratings yet
Lecture 1 Addition What Is Data?
22 pages
Class X IT Periodic Assessment 2023
No ratings yet
Class X IT Periodic Assessment 2023
4 pages
40572a Microsoft Access Expert 2019 Ebook
No ratings yet
40572a Microsoft Access Expert 2019 Ebook
546 pages

Pandas Cheat Sheet

Uploaded by

Pandas Cheat Sheet

Uploaded by

Tajamul Khan

You might also like