0% found this document useful (0 votes)

43 views6 pages

BasicAnalysis Using PYTHON

This document provides a guide for performing basic data analysis using Python with libraries such as Pandas, NumPy, Matplotlib, and Seaborn. It covers installation of libraries, data loading, exploration, cleaning, basic analysis, visualization, and saving cleaned data. The guide includes code examples for each step to help users get started with their data analysis tasks.

Uploaded by

shreyassurve161

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

43 views6 pages

BasicAnalysis Using PYTHON

Uploaded by

shreyassurve161

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 6

To perform basic analysis using Python, you'll primarily use libraries like

Pandas, NumPy, and Matplotlib or Seaborn for data handling, manipulation,

and visualization.

Here's a simple guide to get you started.

1. Install Required Libraries

If you don't already have the libraries installed, you can install them using
pip:

code

pip install pandas numpy matplotlib seaborn

2. Loading Data

First, import the necessary libraries and load the data. You can load data
from various formats like CSV, Excel, etc.

Example for loading a CSV file:

python

import pandas as pd

Load dataset

df = pd.read_csv('your_data.csv')

3. Explore the Data

You can perform some basic exploration to understand the data.

- Check the first few rows of the dataset:

python

df.head()
```

- Get basic info about data types and missing values:

python

df.info()

- Get summary statistics:

python

df.describe()

4. Data Cleaning

This step often involves handling missing data, duplicates, or fixing data
types.

- Handle missing data by filling or dropping:

python

df.fillna(0, inplace=True) # Fill missing values with 0

df.dropna(inplace=True) # Drop rows with missing values

- Drop duplicates :

python

df.drop_duplicates(inplace=True)

5. Basic Analysis

You can begin with basic descriptive statistics and visualizations.

a. Descriptive Statistics
- Mean, median, mode:

python

mean_value = df['column_name'].mean()

median_value = df['column_name'].median()

mode_value = df['column_name'].mode()[0]

- Value counts (for categorical variables):

python

df['category_column'].value_counts()

b. Group By Analysis

You can group data by a particular column and perform aggregate

operations.

python

grouped_data = df.groupby('category_column')['numerical_column'].sum()

c. Correlation

Check the correlation between numerical features.

python

correlation_matrix = df.corr()

print(correlation_matrix)

6. Basic Data Visualization

Visualization is key to data analysis.

a. Histograms
To visualize the distribution of a column:

python

import matplotlib.pyplot as plt

df['column_name'].hist()

plt.show()b. Scatter Plot

To check the relationship between two variables:

python

df.plot(kind='scatter', x='column1', y='column2')

plt.show()

c. Box Plot

To identify outliers:

python

df.boxplot(column='numerical_column')

plt.show()

d. Correlation Heatmap (using Seaborn)

For a more visual representation of correlation:

python

import seaborn as sns

sns.heatmap(df.corr(), annot=True, cmap='coolwarm')

plt.show()

7. Saving Cleaned Data

After cleaning and analysis, you might want to save the processed data.
python

df.to_csv('cleaned_data.csv', index=False)

Example Workflowpython

import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

Load data

df = pd.read_csv('your_data.csv')

Basic exploration

print(df.head())

print(df.info())

print(df.describe())

Handle missing values

df.fillna(0, inplace=True)

Descriptive statistics

print(df['age'].mean()) # Example for 'age' column

print(df['category'].value_counts()) # For categorical data

Visualize data

df['age'].hist()

plt.show()

sns.heatmap(df.corr(), annot=True, cmap='coolwarm')

plt.show()

This workflow should get you started on basic data analysis using Python!
You can further enhance this by using more advanced libraries like SciPy for
statistical analysis or StatsModels for regression and other statistical
models.

Python for Data Analysts
No ratings yet
Python for Data Analysts
2 pages
Beginners Guide To Python For Data Analysis
No ratings yet
Beginners Guide To Python For Data Analysis
2 pages
Data Prep & EDA for Python Users
No ratings yet
Data Prep & EDA for Python Users
12 pages
Data Analysis With Python
No ratings yet
Data Analysis With Python
29 pages
Data Analysis Python
No ratings yet
Data Analysis Python
3 pages
Course - Introduction To Data Science (SD211105)
No ratings yet
Course - Introduction To Data Science (SD211105)
10 pages
Universal Data Analytics Algorithm
No ratings yet
Universal Data Analytics Algorithm
51 pages
Pandas Research
No ratings yet
Pandas Research
14 pages
Financial Analytics With Python
100% (1)
Financial Analytics With Python
40 pages
Usage of NumPy For Numerical Data in Detail
No ratings yet
Usage of NumPy For Numerical Data in Detail
52 pages
Data Analysis With Python Core Libraries
No ratings yet
Data Analysis With Python Core Libraries
5 pages
Unit-2 Bda
No ratings yet
Unit-2 Bda
11 pages
Python For Data Analysis Notes
No ratings yet
Python For Data Analysis Notes
3 pages
Pandas 1702216043
No ratings yet
Pandas 1702216043
86 pages
Python For Data Analysis
No ratings yet
Python For Data Analysis
84 pages
Data Handling Module
No ratings yet
Data Handling Module
10 pages
Python Syntax and Functions For Data Mining
No ratings yet
Python Syntax and Functions For Data Mining
6 pages
Deep Python For Data Analysis
No ratings yet
Deep Python For Data Analysis
4 pages
IP CH 1 12th
No ratings yet
IP CH 1 12th
3 pages
Data Analysis For Beginners Book - 2
100% (1)
Data Analysis For Beginners Book - 2
27 pages
Introduction To Pandas - Loading and Exploring Data
No ratings yet
Introduction To Pandas - Loading and Exploring Data
4 pages
Exploratory Data Analysis
No ratings yet
Exploratory Data Analysis
4 pages
Summary: Introduction To Data Visualization Tools
No ratings yet
Summary: Introduction To Data Visualization Tools
13 pages
Pandas Complete + Visualisation Summary of IBM Visualization
No ratings yet
Pandas Complete + Visualisation Summary of IBM Visualization
21 pages
Practical 1
No ratings yet
Practical 1
5 pages
NumPy and Pandas
No ratings yet
NumPy and Pandas
12 pages
Python Comands
No ratings yet
Python Comands
3 pages
Data Analysis With Python
No ratings yet
Data Analysis With Python
10 pages
Chapter 2. Data Analysis and Processing - Full
No ratings yet
Chapter 2. Data Analysis and Processing - Full
49 pages
Unit 3 (FODS)
No ratings yet
Unit 3 (FODS)
34 pages
Python For Statistics
No ratings yet
Python For Statistics
40 pages
Python For Data Analysis
No ratings yet
Python For Data Analysis
15 pages
Pandas Guide for Beginners
No ratings yet
Pandas Guide for Beginners
18 pages
Pandas PDF
No ratings yet
Pandas PDF
25 pages
Unit 2
No ratings yet
Unit 2
36 pages
Python For Data Analysis Jan 28
No ratings yet
Python For Data Analysis Jan 28
105 pages
Python & MySQL For Data Analysis
No ratings yet
Python & MySQL For Data Analysis
45 pages
Data Analysis
No ratings yet
Data Analysis
4 pages
Pandas
No ratings yet
Pandas
2 pages
Datascience
No ratings yet
Datascience
26 pages
Python Course Outline
No ratings yet
Python Course Outline
24 pages
NumPy and Pandas Step
No ratings yet
NumPy and Pandas Step
9 pages
Data Wrangling & Data Manipulation With Pandas
No ratings yet
Data Wrangling & Data Manipulation With Pandas
6 pages
Pandas Library: Data Manipulation & Analysis Guide
No ratings yet
Pandas Library: Data Manipulation & Analysis Guide
9 pages
Python For Analytics - 2025 - 2020
No ratings yet
Python For Analytics - 2025 - 2020
28 pages
Python EDA Guide for Data Analysts
No ratings yet
Python EDA Guide for Data Analysts
13 pages
Da Pra Week-8 (Karthik S) - 074713
No ratings yet
Da Pra Week-8 (Karthik S) - 074713
9 pages
Chapter1 Notes Python Data Analysis
No ratings yet
Chapter1 Notes Python Data Analysis
2 pages
Python
No ratings yet
Python
3 pages
Unit 1,2
No ratings yet
Unit 1,2
17 pages
Dav 2 Unit
No ratings yet
Dav 2 Unit
55 pages
Pandas Programs
No ratings yet
Pandas Programs
2 pages
EDA Step by Step
No ratings yet
EDA Step by Step
2 pages
Pandas Trampas
No ratings yet
Pandas Trampas
9 pages
Data Analysis With Python
100% (1)
Data Analysis With Python
26 pages
Data Analytics
No ratings yet
Data Analytics
34 pages
Data Aggregation Using Python
No ratings yet
Data Aggregation Using Python
33 pages
Learn Pandas
No ratings yet
Learn Pandas
37 pages
AMA3724
No ratings yet
AMA3724
3 pages
LTE Multicarrier Modulation: OFDMA & SC-OFDMA
No ratings yet
LTE Multicarrier Modulation: OFDMA & SC-OFDMA
63 pages
Wiring Diagram DSE 7320 AMF
100% (1)
Wiring Diagram DSE 7320 AMF
1 page
DR - Srinivas Bachu
No ratings yet
DR - Srinivas Bachu
8 pages
DB en Step Ups 24dc 24dc 3 105623 en 02
No ratings yet
DB en Step Ups 24dc 24dc 3 105623 en 02
21 pages
Real-time Face Recognition with Python
No ratings yet
Real-time Face Recognition with Python
6 pages
CIA2 Group5 Negotiations
No ratings yet
CIA2 Group5 Negotiations
14 pages
Procedure Under E-Tendering Kerala
No ratings yet
Procedure Under E-Tendering Kerala
5 pages
Sun2000-2huawei Sun2000-215ktl-H0 h3 Type Test Verification Report Type A - 25082021
No ratings yet
Sun2000-2huawei Sun2000-215ktl-H0 h3 Type Test Verification Report Type A - 25082021
30 pages
Cybersecurity101 2019 Final With Links
No ratings yet
Cybersecurity101 2019 Final With Links
28 pages
IFHE-Distance BBA Prospectus - July 2024
No ratings yet
IFHE-Distance BBA Prospectus - July 2024
8 pages
BOP Drawings by Sections, Rev
100% (1)
BOP Drawings by Sections, Rev
10 pages
Computer Science Resume
100% (1)
Computer Science Resume
6 pages
1centrifugal Pump
No ratings yet
1centrifugal Pump
10 pages
PCI Professional Training Course Description
0% (1)
PCI Professional Training Course Description
2 pages
Assessment 1 Magil
No ratings yet
Assessment 1 Magil
12 pages
Keysight Spectrum Analysis Basics 2015
No ratings yet
Keysight Spectrum Analysis Basics 2015
89 pages
WI1 3E Relay
100% (1)
WI1 3E Relay
30 pages
Diesel Pump Service Price List 2023
No ratings yet
Diesel Pump Service Price List 2023
1 page
Maths Roadmap For Machine Learning
No ratings yet
Maths Roadmap For Machine Learning
21 pages
09 KHD Ball Mill
100% (1)
09 KHD Ball Mill
101 pages
TL103 Inf4831
No ratings yet
TL103 Inf4831
7 pages
Tensor Numerical Methods in Scientific Computing Boris N Khoromskij Download
100% (8)
Tensor Numerical Methods in Scientific Computing Boris N Khoromskij Download
83 pages
CW2 - Initial Data
No ratings yet
CW2 - Initial Data
5 pages
Thermofluids Laboratory Report
No ratings yet
Thermofluids Laboratory Report
28 pages
Binder 1
No ratings yet
Binder 1
30 pages
FN595NWS
No ratings yet
FN595NWS
53 pages
HAZOP Training
No ratings yet
HAZOP Training
21 pages
Abcdegdg
No ratings yet
Abcdegdg
1 page
Design and Operation of Cyclones
No ratings yet
Design and Operation of Cyclones
40 pages