0% found this document useful (0 votes)

20 views2 pages

Assignment 4

assignment

Uploaded by

delbertsmith524

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

20 views2 pages

Assignment 4

assignment

Uploaded by

delbertsmith524

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 2

Q1) Load the built-in R dataset air quality.

Inspect the summary statistics of the dataset

along with the covariance and correlation matrix. (8 marks)

Ans) To load the built-in airquality dataset in R, use the command data("airquality"), which
loads air quality measurements from New York City. To inspect the summary statistics of the
dataset, use summary (airquality). This provides a detailed overview of each variable,
including the minimum, first quartile, median, mean, third quartile, and maximum values. It
helps identify the distribution of the data and any potential outliers or missing values. To
examine the relationships between the numeric variables, calculate the covariance matrix
using cov(airquality[, sapply(airquality, is.numeric)]). Covariance indicates how the variables
vary together, with positive values showing that variables increase or decrease together, and
negative values indicating an inverse relationship. Compute the correlation matrix with
cor(airquality[, sapply(airquality, is.numeric)]), which standardizes the relationships between
variables. The correlation matrix reveals the strength and direction of the linear relationships
between numeric variables, helping identify patterns or dependencies within the data.

Q2) Visualize the data to understand the distribution and relationships of air quality
measurements. (4 marks)

Q2a. Load the airquality dataset using data ("airquality") and display the first few
rows. (2 marks)

To load the airquality dataset, use the data ("airquality") function in R. This command
loads the dataset, which contains air quality measurements in New York City. To display the
first few rows of the dataset and get an initial understanding of its structure, use the head
(airquality) function. This will show you a snapshot of the data, including the first few entries
for each variable, helping you understand the variables present and their initial values. To
inspect the summary statistics of the airquality dataset, use the summary (airquality) function
in R. This function provides essential descriptive statistics for each variable, including the
minimum, first quartile, median, mean, third quartile, and maximum values. These statistics
give a comprehensive overview of the distribution, central tendency, and range of the data,
helping to identify patterns, detect outliers, and understand the variability of the air quality
measurements across the dataset.
To calculate and display the covariance and correlation matrices for the numeric
columns in the airquality dataset, use the following code: cov_matrix <- cov(airquality[,
sapply(airquality, is.numeric)]) to compute the covariance matrix and cor_matrix <-
cor(airquality[, sapply(airquality, is.numeric)]) to compute the correlation matrix. The
covariance matrix shows how numeric variables vary together, indicating the degree to which
two variables change in relation to each other. The correlation matrix, on the other hand,
reveals the strength and direction of the linear relationships between the variables, with
values ranging from -1 to 1. Both matrices provide valuable insights into the
interdependencies and associations among the numeric variables in the dataset.

Q2b.Use pairs () to create a scatter plot matrix to visualize relationships between the
numeric variables.

Experiment Number: 1: Installation
No ratings yet
Experiment Number: 1: Installation
6 pages
Assignment R
No ratings yet
Assignment R
9 pages
Assignment R Vaibhav
No ratings yet
Assignment R Vaibhav
9 pages
Model R
No ratings yet
Model R
22 pages
Questions With No Solutions
No ratings yet
Questions With No Solutions
20 pages
Dma 89
No ratings yet
Dma 89
21 pages
Ds 1
No ratings yet
Ds 1
22 pages
Data Visualization in R
No ratings yet
Data Visualization in R
12 pages
Unit 5 To Students
No ratings yet
Unit 5 To Students
41 pages
Visualizing A Single Variable Using R
No ratings yet
Visualizing A Single Variable Using R
9 pages
Att - IzMfUSJyC W17j1N1O PrxUuUkil9-Q8nxS1QMaV6u8
No ratings yet
Att - IzMfUSJyC W17j1N1O PrxUuUkil9-Q8nxS1QMaV6u8
28 pages
R-Data Exploration and Descriptives
No ratings yet
R-Data Exploration and Descriptives
7 pages
CS PRAC ML - ML
No ratings yet
CS PRAC ML - ML
29 pages
BDAExp 8
No ratings yet
BDAExp 8
9 pages
Exemplar - Explore Confidence Intervals
No ratings yet
Exemplar - Explore Confidence Intervals
11 pages
Unit 11 Working With Vector Data Using R
No ratings yet
Unit 11 Working With Vector Data Using R
21 pages
Dev Lab Questions
No ratings yet
Dev Lab Questions
3 pages
R Data Analysis and Manipulation Tasks
No ratings yet
R Data Analysis and Manipulation Tasks
21 pages
Analisis Peubah Ganda: Pertemuan VIII
No ratings yet
Analisis Peubah Ganda: Pertemuan VIII
163 pages
Sample Template File For Project
No ratings yet
Sample Template File For Project
8 pages
ICT Report
No ratings yet
ICT Report
21 pages
Data Visualization
No ratings yet
Data Visualization
5 pages
Exemplar - Dataframes With Pandas
No ratings yet
Exemplar - Dataframes With Pandas
11 pages
XSTK 66
No ratings yet
XSTK 66
5 pages
Tutorial 4
No ratings yet
Tutorial 4
16 pages
Data Cleaning
No ratings yet
Data Cleaning
4 pages
Exemplar - Explore Hypothesis Testing
No ratings yet
Exemplar - Explore Hypothesis Testing
11 pages
PFDA Khalil Mirza TP053846
No ratings yet
PFDA Khalil Mirza TP053846
39 pages
Lab 05 Questions
No ratings yet
Lab 05 Questions
7 pages
CSE315:Introduction To Data Science: WEEK-8
No ratings yet
CSE315:Introduction To Data Science: WEEK-8
27 pages
A056 PS Exp2
No ratings yet
A056 PS Exp2
6 pages
Note 2
No ratings yet
Note 2
27 pages
DATAMINING
No ratings yet
DATAMINING
24 pages
Air Quality Analysis
No ratings yet
Air Quality Analysis
17 pages
Thermal Comfort Indices Tool
No ratings yet
Thermal Comfort Indices Tool
5 pages
Presentation AirQuality Prediction Using Machine Learning
No ratings yet
Presentation AirQuality Prediction Using Machine Learning
16 pages
DAP Report
No ratings yet
DAP Report
29 pages
Eda Assessment 3 24mdt0066
No ratings yet
Eda Assessment 3 24mdt0066
9 pages
R Examples
No ratings yet
R Examples
56 pages
Exploratory Graphs
No ratings yet
Exploratory Graphs
23 pages
MATH3806 Group Report
No ratings yet
MATH3806 Group Report
13 pages
Dev Lab Manual Org
No ratings yet
Dev Lab Manual Org
28 pages
R Programming Exercises
No ratings yet
R Programming Exercises
38 pages
and Data/uk - and - Regional - Series
0% (1)
and Data/uk - and - Regional - Series
5 pages
R Functions
No ratings yet
R Functions
8 pages
Exploratory Data Analysis
No ratings yet
Exploratory Data Analysis
14 pages
Ayush Sonar 310104230868 Practical 3 DS R
No ratings yet
Ayush Sonar 310104230868 Practical 3 DS R
10 pages
DS Exp 1-1
No ratings yet
DS Exp 1-1
7 pages
PracticalMachine Learning
No ratings yet
PracticalMachine Learning
32 pages
Report Latest - RK
No ratings yet
Report Latest - RK
20 pages
Multiple-Regression Airquality
No ratings yet
Multiple-Regression Airquality
7 pages
Data Analysis Python R Scilab Practicals
No ratings yet
Data Analysis Python R Scilab Practicals
10 pages
Module - 4 (R Training) - Basic Stats & Modeling
No ratings yet
Module - 4 (R Training) - Basic Stats & Modeling
15 pages
Advanced Calculus for Engineers
No ratings yet
Advanced Calculus for Engineers
13 pages
Quantitative Research Reviewer
No ratings yet
Quantitative Research Reviewer
2 pages
North East Research Paper
No ratings yet
North East Research Paper
38 pages
Effects of Talent Management On Organizational Trus
No ratings yet
Effects of Talent Management On Organizational Trus
9 pages
Grade 9 Education Impact Study
100% (1)
Grade 9 Education Impact Study
14 pages
Total Quality Management Performance in Multinational Companies - A Learning Perspective PDF
No ratings yet
Total Quality Management Performance in Multinational Companies - A Learning Perspective PDF
15 pages
Dissertation Writing Essentials
100% (2)
Dissertation Writing Essentials
8 pages
Chapter 3 Thesis Data Gathering Procedure
100% (2)
Chapter 3 Thesis Data Gathering Procedure
5 pages
Evaluation of Nursing Interns' Portfolio and Faculty Raters' Satisfaction
No ratings yet
Evaluation of Nursing Interns' Portfolio and Faculty Raters' Satisfaction
6 pages
(Ebook PDF) Stat2: Building Models For A World of Data PDF Download
100% (2)
(Ebook PDF) Stat2: Building Models For A World of Data PDF Download
55 pages
Work at Heights Permit
100% (1)
Work at Heights Permit
4 pages
BMR 21
No ratings yet
BMR 21
16 pages
PARTS OF A RESEARCH THESIS-Copy1
No ratings yet
PARTS OF A RESEARCH THESIS-Copy1
48 pages
Exploring Gamification in English Language Teaching (Elt) Enhancing Motivation and Engagement in Language Learning
No ratings yet
Exploring Gamification in English Language Teaching (Elt) Enhancing Motivation and Engagement in Language Learning
11 pages
GSM 5114 Questions & Answers
100% (2)
GSM 5114 Questions & Answers
7 pages
What Is The General Objective of Planning For An Audit?
No ratings yet
What Is The General Objective of Planning For An Audit?
6 pages
Cover Letter & Resume
No ratings yet
Cover Letter & Resume
3 pages
Edp3141-Educational Research Methods
No ratings yet
Edp3141-Educational Research Methods
181 pages
Strategies in Income Budgeting
No ratings yet
Strategies in Income Budgeting
35 pages
Research
No ratings yet
Research
51 pages
Quechua Vowel Alternation Thesis
100% (2)
Quechua Vowel Alternation Thesis
73 pages
Introduction To Probability and Statistics
No ratings yet
Introduction To Probability and Statistics
48 pages
Psychological Testing and Assessment INTRO
86% (7)
Psychological Testing and Assessment INTRO
3 pages
Individual Written Assignment Guide
No ratings yet
Individual Written Assignment Guide
14 pages
GIS Grid Interpolation Methods
No ratings yet
GIS Grid Interpolation Methods
2 pages
MKT20019-Assignment 3 - Group Research Report-Group 2
No ratings yet
MKT20019-Assignment 3 - Group Research Report-Group 2
42 pages
Prevention of Sport Injury I
No ratings yet
Prevention of Sport Injury I
3 pages
Programme Dashboard Lend Lease Last Updated: Checklist Programme Dates Per Plot
No ratings yet
Programme Dashboard Lend Lease Last Updated: Checklist Programme Dates Per Plot
1 page
Teachers, Practical Research
No ratings yet
Teachers, Practical Research
22 pages
Research Methods
38% (8)
Research Methods
55 pages

Assignment 4

Uploaded by

Assignment 4

Uploaded by

Q1) Load the built-in R dataset air quality.

Inspect the summary statistics of the dataset

You might also like