forked from rse-r/intro-ii-r-ggplot-ex-ggplot2-template
-
Notifications
You must be signed in to change notification settings - Fork 0
/
01-ggplot2.Rmd
95 lines (71 loc) · 2.5 KB
/
01-ggplot2.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
---
title: "Gráficos con ggplot2"
author: "<tu nombre>"
date: "2024-07-11"
output: html_document
editor_options:
markdown:
wrap: sentence
---
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
library(datos)
library(ggplot2)
library(readr)
library(tidyverse)
```
# Preparación
Esta vez vamos a trabajar con los datos `millas` del paquete datos.
Familiarizate con los datos igual que hiciste en el ejercicio anterior.
```{r}
millas <- datos::millas
```
En los ejercicios siguientes, vas a hacer varios gráficos.
Además de escribir el código para generar el gráfico, escribí como mínimo una oración describiendo qué es lo que ves.
¿Qué relación hay entre las variables?
¿Qué hipótesis te surgen?
# Ejercicios
1. Hacé un gráfico de puntos de "autopista" versus "cilindros". ¿Qué conclusión sacás?
```{r}
ggplot(millas,
aes(autopista, cilindros)) +
geom_point()
```
2. Hacé un gráfico similar pero de "autopista" versus "ciudad".
```{r}
ggplot(data=millas)+
aes(x=autopista, y=ciudad)+
geom_point()
```
3. ¿Qué pasa cuando haces un gráfico de de "clase" versus "traccion"? ¿Por qué no es útil este gráfico?
```{r}
ggplot(data=millas)+
aes(x=clase,y=traccion)+
geom_point()
```
4. En otro bloque, rehacé el gráfico de "autopista" versus "ciudad" pero ahora asigná la variable "tracción" al color de los puntos.
```{r}
ggplot(data=millas)+
aes(x=autopista,y=ciudad,color=traccion)+
geom_point()
```
5. ¿Qué ocurre si se asigna o mapea una estética a algo diferente del nombre de una variable, como `aes(color = cilindrada < 3)`?
```{r}
ggplot(data=millas)+
aes(x=autopista,y=ciudad,color=cilindrada < 3)+
geom_jitter(width = 0.25)
```
6. ¿Notás algún problema con los gráfico anterior?
Pensá en qué valores toman los datos de `ciudad` y `autopista`, ¿es posible que no haya ningún auto que haga 20.3 millas por galón en autopista?
¿Qué problemas puede traer eso?
Por ejemplo, mirando el gráfico, ¿cuántos autos existe que hagan 20 millas en autopista y 15 en ciudad?
es imposible ya que no se mide con valores decimales, solo enteros.
```{r}
Auto_15_20<-millas %>%
filter(ciudad == "15" & autopista == "20")
Auto_15_20
```
7. En el gráfico anterior, reemplazá `geom_point()` por `geom_jitter()`.
¿Qué es lo que sucede?
(Podés fijate en la ayuda de `geom_jitter()` si no entendés qué es lo que hace.) ¿Qué ventajas y desventajas tiene este geom?
Mayor dispersion de los puntos