-
Notifications
You must be signed in to change notification settings - Fork 2
/
Copy pathtalk09.Rmd
1910 lines (1318 loc) · 46.5 KB
/
talk09.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
---
title: "R for bioinformatics, data visualisation"
subtitle: "HUST Bioinformatics course series"
author: "Wei-Hua Chen (CC BY-NC 4.0)"
institute: "HUST, China"
date: "`r format(Sys.time(), '%d %B, %Y')`"
output:
beamer_presentation:
theme: AnnArbor
colortheme: beaver
fonttheme: structurebold
highlight: tango
includes:
in_header: mystyle.sty
---
```{r include=FALSE}
color_block = function(color) {
function(x, options) sprintf('\\color{%s}\\begin{verbatim}%s\\end{verbatim}',
color, x)
}
## 将错误信息用红色字体显示
knitr::knit_hooks$set(error = color_block('red'))
```
# section 1: TOC
## 前情提要
### iterations 与 并行计算
* for loop
* ``` apply ``` functions
* ``` dplyr ``` 的本质是 遍历
* ``` map ``` functions in ```purrr ``` package
* 遍历 与 并行计算
### 相关包
* purrr
* parallel
* foreach
* iterators
## 本次提要
* basic plot functions
* basic ggplot2
* special letters
* equations
* advanced ggplot2
# section 2: basic plot functions using R
## R basic plot functions
过去几节课我们已经使用了 R basic plot 和 ggplot2 的一些绘画功能,比如讲factor时。今次我们进行系统的介绍。
基础做图由 ``` plot ``` 提供。先看示例。这里我们使用系统自带的 ``` swiss ``` 数据,它包含了47个法语地区的一些社会经济指标。
\FontSmall
```{r}
head(swiss);
```
## 散点图 (dot plot)
我们看一下 教育 与生育率的关系:
\FontSmall
```{r fig.height=4, fig.width=10}
with( swiss, plot( Education, Fertility ) );
```
\FontNormal
**注意** ``` with ``` 的作用是什么??
## plot 的参数初探: 先看示例
\FontSmall
```{r fig.height=4, fig.width=10}
with( swiss, plot(Education, Fertility, type = "p", main = "Swiss data 1888",
sub = "Socioeconomic indicators & Fertility",
xlab = "Education", ylab = "Fertility", col = "darkblue",
xlim = range( Education ), ylim = range( Fertility ),
pch = 20, frame.plot = F) );
```
## plot 参数, an annotated example
![an annotated example](images/talk09/plot_annotated_example.png){height=70%}
## plot 支持的画图类型, 参数 ``` type = '?' ``` 的取值
\FontSmall
```{r fig.height=5, fig.width=10}
par( mfrow = c(2,4) ); ### 在一张图上画 2 x 4 个 panel
opts <- c( "p", "l", "o", "b", "c", "s", "S", "h" );
for( o in opts ){
plot(1:5, type = o, main = paste( "type=", o ) );
}
```
## pch 是什么?
决定了数据点的形状,注意它的取值范围
\FontSmall
```{r fig.height=3.5, fig.width=10, warning=FALSE, message=FALSE}
library(tidyverse); library(extrafont);
ggplot( data.frame( p = c(0:25, 32:127) ) ) +
scale_y_continuous( name = "" ) + scale_x_continuous( name = "" ) +
scale_shape_identity() +
geom_point( aes( x = p%%16, y = p%/%16, shape = p ), size = 5, fill = "red" ) +
geom_text( aes( x = p %% 16, y = p%/%16 + 0.4, label = p ), size = 3 );
```
## log transform aexes
``` plot ``` 还有一些其它有用的参数,详见: ``` ? plot.default ```
\FontSmall
```{r fig.height=3.5, fig.width=10}
with( swiss, plot(Education, Fertility, type = "p", main = "Swiss data 1888",
sub = "Socioeconomic indicators & Fertility",
xlab = "Education", ylab = "Fertility", col = c("darkblue", "darkred"),
xlim = range( Education ), ylim = range( Fertility ),
pch = 0:25, frame.plot = F, log = "xy") );
## 注: 也可以用 log='x' 或 log='y' 只对一个axis 进行 log 处理
```
## ggplot 版本
\FontSmall
```{r fig.height=4, fig.width=10}
ggplot( swiss, aes( x = Education, y = Fertility ) ) +
geom_point( ) + scale_x_log10() + scale_y_log10() +
xlab( "Education" ) + ylab( "Fertility" ) +
ggtitle( "Swiss data 1888" );
```
## ggplot 更多散点示例
以 ``` mtcars ``` 为例
\FontSmall
```{r fig.height=4, fig.width=10}
ggplot( mtcars, aes( x = wt, y = mpg, colour = factor( cyl ), shape = factor(cyl) ) ) +
geom_point() + xlab( "Weight (1000 lbs)" ) + ylab( "Miles/(US) gallon" ) +
labs( colour = "Number of cylinders", shape = "Number of cylinders" ) ;
```
## plot: high-level vs. low-level plots
* **high level**: plotting functions create a new plot on the graphics device
* **low level**: plotting functions add more information to an existing plot
\FontSmall
```{r fig.height=4, fig.width=10}
plot( 1:10, col = "red" ); ## high level
points( sample(1:10, 10), col = "darkgreen", pch = 20 ); ## low level
```
## low level plots 列表
* ``` points ``` : 点图
* ``` lines ``` : 线图
* ``` abline ``` : 直线
* ``` polygon ``` : 多边形
* ``` legend ``` : 图例
* ``` title ``` : 标题
* ``` axis ``` : 轴
...
## high level plots 列表
* ``` plot ``` : 通用画图函数
* ``` pairs ```
* ``` coplot ```
* ``` qqnorm ```
* ``` hist ```
* ``` dotchart ```
* ``` image ```
* ``` contour ```
...
**注**: 可以用 ``` add = TRUE ``` 参数(如果可用)将 high level 函数强制转换为 low level
## 图形相关参数(系统函数)
``` par() ``` 函数: 显示或修改当前**图形设备**的参数。用以下命令查看支持的内容:
\FontSmall
```{r}
par( c( "mar", "bg" ) ); ## 显示指定参数的值
## 显示所有参数
par();
```
## 调整 ``` par() ``` 参数前请备份
``` par() ``` 用于指定全局参数,因此在改变前尽量备份
\FontSmall
```{r eval=FALSE}
oldpar <- par(); ## 备份
# do some changes here ...
## 恢复
par( oldpar );
```
## 常用图形参数及调整: margin
图形边距( figure margins )
\FontSmall
``` {r eval=FALSE}
par( mar = c( 5.1, 4.1, 4.1, 2.1 )); ## 设置新 martin
```
\FontNormal
分别指定 下 -> 左 -> 上 -> 右 的边距,即从下面开始,顺时针移动。
单位是: text lines
或:
\FontSmall
``` {r eval=FALSE}
par( mai = c( 5.1, 4.1, 4.1, 2.1 )); ## 设置新 martin
```
\FontNormal
单位是: inch
## 常用图形参数及调整: 多panel
画 2x3 共 6个panel,从左到右。(2行3列)
\FontSmall
```{r fig.height=4, fig.width=10}
par( mfrow=c(2,3) );
for( i in 1:6 )
plot( sample( 1:10, 10 ), main = i );
```
## 常用图形参数及调整: 多panel , cont.
\FontNormal
画 2x3 共 6个panel,从上到下。(2行3列)
\FontSmall
```{r fig.height=4, fig.width=10}
par( mfcol=c(2,3) );
for( i in 1:6 )
plot( sample( 1:10, 10 ), main = i );
```
## 重要概念:图形设备
**图形设备**是指图形输出的设备,可以将**图形设备**理解为**保存格式** 。
默认设备是:
* X11() : *nix
* windows() : windows
* quartz() : OS X
图形显示在**显示器**上。
## 图形设备:cont.
常用其它设备有:
* pdf()
* png()
* jpeg()
分别对应输出文件格式。
## 常用图形设备: pdf()
使用方法如下:
\FontSmall
```{r eval=FALSE}
svg( file = "talk09_data/abc.svg", height = 5, width = 5 ); ## 创建一个新设备/ pdf 文件
plot(1:10); ## 作图;
dev.off(); ## 关闭设备
```
\FontNormal
**说明**
1. 默认文件名为 ``` Rplots.pdf ``` ,
2. ```dev.off() ``` 必须关闭。关闭后,返回到最近使用的图形设备
3. ``` height ``` 和 ``` width ``` 参数的单位是 inch
4. 如果运行多个 high level 作图命令,则会产生**多页pdf**
## 请尽量使用 pdf 作为文件输出格式
1. 生信图片大多是点线图,适合保存为矢量格式(如pdf, ps 等);
2. 矢量图可无限放大而不失真(变成像素);
3. 可由 Adobe Illustrator 等矢量图软件进行编辑
# section 3: ggplot2 基础
## 为什么要使用 ggplot2 ? 从一个简单示例开始
假设画两条线:
\FontSmall
```{r fig.width=10, fig.height=4}
year1 <- c(7, 12, 28, 3, 41);
year2 <- c(14, 7, 6, 19, 3);
plot( year1, type = "o", pch = 20, col = "red", xlab = "Month", ylab = "Rain fall",
main = "Rain fall chart");
lines( year2, type = "o", pch = 20, col = "blue");
```
## 如果改变画线的顺序?
\FontSmall
```{r fig.width=10, fig.height=4}
plot( year2, type = "o", pch = 20, col = "blue", xlab = "Month", ylab = "Rain fall",
main = "Rain fall chart");
lines( year1, type = "o", pch = 20, col = "red");
```
## ggplot2 的方法
\FontSmall
```{r fig.width=10, fig.height=3}
df <- rbind( tibble( month = 1:length( year1 ), value = year1, cat = "Year1" ), tibble( month = 1:length( year2 ), value = year2, cat = "Year2 ") );
plot1 <- ## 将图保存在变量中;
ggplot( df, aes( x = month, y = value, colour = cat) ) +
geom_line() + geom_point() +
xlab( "Month" ) + ylab( "Rain fall" ) +
labs( colour = "Year");
plot1; ## 画图
```
## ggplot2 基础概念详解
![ggplot2 参数简介](images/talk09/ggplot_explained.png){height=20%}
1. aes (aesthetics)美学:控制全局参数,包括:x,y轴使用的数据,颜色( colour, fill) ,形状 ( shape ),大小 ( size ),分组 ( group ) 等等;
2. 图层: ``` geom_<layer_name> ``` ;每张图可有多个图层(此处有两个);图层可使用全局数据 (df) 和参数 (aes),也可以使用自己的 aes 和 数据;
3-4. 其它参数
## ggplot2 优缺点
ggplot2 优点:
1. 强大又专业
2. 复杂又好看
3. canvas 大小,坐标会根据数据、图层自动调整,让用户专注于作图本身;
缺点:
太难学!
## 图层使用自己的数据,示例
\FontSmall
```{r fig.height=3, fig.width=10}
plot1 +
geom_point( data = data.frame( x2 = 1:5, y2 = sample(30:100, 5) ), ## 注意: data = 是必须的
aes( x = x2, y = y2 ), ## 使用自己的 aes ...
colour = c("darkgreen", "red", "blue", "gold", "purple") , shape = 15, size = 4 )
```
\FontNormal
**要点**
1. 如上所见,xy -axes 会随数据自动调整
2. ggplot2 作图结果可以保存在变量中,并可累加更多图层
3. 图层使用自己的数据时,需要用 ``` data = ``` 指定;而全局数据则不用 ``` ggplot ( data.frame( ... ) ) ```
## ``` aes( ) ``` 内部和外部的 coulor, size, shape 参数有何区别?
在内部时, ``` colour = <列名> ``` 或 ``` colour = factor( <列名> ) ``` ,其真实结果是取 <列名> 的 factor ,然后按顺序为每个 factor **自动指定**一个颜色。默认**颜色顺序**为:
![default discrete colour palette](images/talk09/ggplot_default_palette.png){height=40%}
## color 举例
\FontSmall
```{r fig.height=3, fig.width=10}
plot1 +
geom_point( data = data.frame( x2 = 1:5, y2 = sample(30:100, 5) ), ## 注意: data = 是必须的
aes( x = x2, y = y2 , colour = factor( y2 ) ), ## colour 在 aes 内部
shape = 15, size = 4 )
```
\FontNormal
共有7个颜色;注意与上页图的第7行对应一下!
## 当 ``` colour = <数字列> ``` ,则显示 color gradient
\FontSmall
```{r fig.height=3, fig.width=10}
ggplot( data = data.frame( x2 = 1:5, y2 = sample(30:100, 5) ),
aes( x = x2, y = y2 , colour = y2 ) ) +
geom_point( shape = 15, size = 4 )
```
\FontNormal
**注意** discrete color (上页图) 和 continous color ( or color gradient )的默认画板 (color palette) 是不一样的!
## 更改画板,使用指定的颜色(不作为factor使用)
\FontSmall
```{r fig.height=4, fig.width=10}
df$col <- sample( colours(), 10 ); ## 现有我们有颜色了!
ggplot(df, aes( x = month, y = value, colour = col ) ) +
geom_point( size = 4, shape = 15 ) + facet_grid( ~ cat );
```
\FontNormal
** 注 ** 默认情况下, ``` col ``` (颜色)列是作为 factor 使用。
## 更改画板,使用指定的颜色(不作为factor使用),cont.
解决方案: ``` scale_color_identity ```
\FontSmall
```{r fig.height=4, fig.width=10}
ggplot(df, aes( x = month, y = value, colour = col ) ) +
geom_point( size = 4, shape = 15 ) + facet_grid( ~ cat ) + ## facet_grid 又是什么??
scale_color_identity(); ## magic !!
```
## 图层简介
* ``` geom_point ``` , ``` geom_line ```: 点线图,用于揭示两组数据间的关系;
* ``` geom_smooth ``` : 常与 ``` geom_point ``` 联合使用,揭示数据走势
* ``` geom_bar ``` : bar 图
* ``` geom_boxplot ``` : 箱线图,用于比较N组数据,揭示区别
* ``` geom_path ``` : 与``` geom_line ``` 相似,但也可以画其它复杂图形
* ``` geom_histogram ```, `` geom_density ``` : 数据的分布,也可用于多组间的比较
* 其它十余种,请见“ggplot2 : elegant graphics for data analysis” 一书!!
# section 4: ggplot2作图的四个基本组成部分
## ggplot2的四个基本组成
1. 图层(layers)
* ```geom_<图层名>```
2. scale:控制数据至美学属性的mapping
* ```scale_<属性mapping方式>```,e.g. ```scale_color_identity()```
![数据的4种scale方法](images/talk09/scale.png){height=30%}
## ggplot2的scale
* ```scale_color_...```
* ```scale_shape_...```
* ```scale_size_...```
* ```scale_fill_...```
与坐标系统联动的函数
* ```scale_x_log()```
* ```scale_y_log()```
更多内容可以见《ggplot2: elegant graphics for data analysis》一书的第6章。
## ggplot2要素3: 坐标系统
* 正常
* log-transform
示例:
\FontSmall
```{r fig.height=3, fig.width=10}
ggplot(mtcars, aes( wt , mpg)) + geom_point() +
scale_y_log10()
```
## ggplot2要素3: 坐标系统,cont.
\FontSmall
```{r fig.height=3, fig.width=10}
ggplot(mtcars, aes( wt , mpg)) + geom_point() +
coord_trans( y = "log10" );
```
```coord_trans()```的其它参数:
* limx, limy: 限制xy的显示范围
## ggplot2要素3: 坐标系统,cont.
其它函数
* ```coord_flip()``` : x,y轴互换;竖bar变横bar;
* ```coord_polar()``` :
\FontSmall
```{r fig.height=3, fig.width=10}
plot1 <- ggplot(mtcars, aes(x = factor(cyl))) +
geom_bar(width = 1, colour = "black");
plot1;
```
## ggplot2要素3: 坐标系统,cont.
\FontSmall
```{r fig.height=3, fig.width=10}
plot1 + coord_polar();
```
\FontNormal
更多内容可以见《ggplot2: elegant graphics for data analysis》一书的第7章。
## ggplot2要素4: faceting ...
\FontSmall
```{r fig.height=3, fig.width=10}
qplot(displ, hwy, data=mpg, facets = . ~ year) + geom_smooth();
```
# ggplot2 进阶 1 :如何找到合适的颜色?
## `ggplot2` 的颜色系统
### `color` basics
* pick `one` color with R
* use a `color palette`
### use `scale_colour_` or `scale_fill_` functions to change the mapping
* map `category` variables to colors
* map `numeric` variables to colors
### change `color palette`
* default R and ggplot2 palette
* other useful palette
## `color` basics
\FontSmall
```{r fig.height=2.5, fig.width=8}
library(ggplot2);
ggplot(iris, aes(x=Sepal.Length, y=Sepal.Width, color=Species)) +
geom_point(size=2) +
scale_color_manual(values = c("cyan", rgb(255, 255, 0, maxColorValue = 255), "#7884CF" ));
```
### pick a color by
name, `rgb()`, Hex code, Number
## use a color palette, discrete colors
\FontSmall
```{r fig.height=3, fig.width=8}
mtcars %>% ggplot( aes(disp, mpg) ) + geom_point( aes( color = factor(cyl) ) )
```
默认使用 `scale_colour_hue()` 颜色;
## `scale_colour_hue()`
![default discrete colour palette](images/talk09/ggplot_default_palette.png){height=40%}
\FontSmall
```{r eval=FALSE}
scale_colour_hue(
...,
h = c(0, 360) + 15,
c = 100,
l = 65,
h.start = 0,
direction = 1,
na.value = "grey50",
aesthetics = "colour"
)
```
## `scale_colour_brewer()` 更易用
![](images/talk09/ggplot_brewer_palettes.png){height=90%}
## `scale_colour_brewer()`, cont.
\FontSmall
```{r fig.height=3, fig.width=8}
mtcars %>% ggplot( aes(disp, mpg) ) + geom_point( aes( color = factor(cyl) ) ) +
scale_color_brewer( palette = "Set1" );
```
## Palettes provided by `scale_color_brewer()`
使用方法:
```{r eval=FALSE}
+ scale_color_brewer( palette = "<palette name>" );
```
\FontSmall
### Diverging
BrBG, PiYG, PRGn, PuOr, RdBu, RdGy, RdYlBu, RdYlGn, Spectral
### Qualitative
Accent, Dark2, Paired, Pastel1, Pastel2, Set1, Set2, Set3
### Sequential
Blues, BuGn, BuPu, GnBu, Greens, Greys, Oranges, OrRd, PuBu, PuBuGn, PuRd, Purples, RdPu, Reds, YlGn, YlGnBu, YlOrBr, YlOrRd
## set color manualy : `scale_colour_manual()`
\FontSmall
```{r fig.height=4, fig.width=10}
mtcars %>% ggplot( aes(disp, mpg) ) + geom_point( aes( color = factor(cyl) ) ) +
scale_color_manual( breaks = c("4","6","8"), values = c("red","green","blue") );
```
## map colors to continous/ numeric values
\FontSmall
```{r fig.height=4, fig.width=10}
mpg %>% ggplot( aes(displ, hwy) ) + geom_point( aes( color = cyl ) );
```
默认为: `scale_color_gradient()`
## `scale_color_gradient()` 改变颜色更容易一些
\FontSmall
```{r eval=FALSE}
scale_colour_gradient(
...,
low = "#132B43",
high = "#56B1F7",
space = "Lab",
na.value = "grey50",
guide = "colourbar",
aesthetics = "colour"
)
```
改变 low 和 high 的值即可;
## `scale_color_gradient()` 举例
\FontSmall
```{r fig.height=4, fig.width=10}
mpg %>% ggplot( aes(displ, hwy) ) + geom_point( aes( color = cyl ) ) +
scale_color_gradient( low = "black", high = "yellow" );
```
## `scale_color_gradient2()` 3个颜色
\FontSmall
```{r fig.height=4, fig.width=10}
mpg %>% ggplot( aes(displ, hwy) ) + geom_point( aes( color = cyl ) ) +
scale_colour_gradient2( low = "black", mid = "red", high = "yellow", midpoint = 6 );
```
**注意** try change the `midpoint` option
## `scale_colour_gradientn` multiple colors
\FontSmall
```{r fig.height=4, fig.width=10}
mpg %>% ggplot( aes(displ, hwy) ) + geom_point( aes( color = cyl ) ) +
scale_colour_gradientn( colors = c("black","red", "yellow") );
```
## `scale_colour_binned` gradient 颜色的另一种方式
\FontSmall
```{r fig.height=4, fig.width=10}
mpg %>% ggplot( aes(displ, hwy) ) + geom_point( aes( color = cyl ) ) +
scale_color_binned( low = "black", high = "yellow" );
```
## `scale_fill_XX` functions
\FontSmall
* 颜色的使用与 `aes` 是配套的:`aes` 使用 `fill` 时,颜色可使用 `scale_fill_xx`
```{r fig.height=3, fig.width=8}
mpg %>% ggplot( aes(x=displ, y=hwy) ) +
geom_point( shape = 21, aes( fill = factor(cyl) ) ) +
scale_fill_brewer( palette = "Set2" );
```
## `scale_fill_XX` functions, cont.
* `fill` 为连续值时,需要使用对应连续变量的调色板
\FontSmall
```{r fig.height=3, fig.width=6}
mpg %>% ggplot( aes(x=displ, y=hwy) ) +
geom_point( shape = 21, aes( fill = cyl ) ) +
scale_fill_continuous( );
```
## 一个较为复杂的例子
同一图中,可对不同对象使用不同(类型)的调色板
\FontSmall
```{r fig.height=4, fig.width=10}
ggplot(ToothGrowth, aes(x=factor(dose), y=len, fill=dose, color = factor(dose))) +
geom_boxplot() + scale_fill_gradientn( colors = c("black","red", "yellow") ) +
scale_colour_manual( values = c("pink", "green", "blue") ) + coord_flip();
```
## other palettes and related functions
### included in ggplot2
`scale_color_hue`, `scale_color_manual`, `scale_color_grey`, `scale_colour_viridis_d`, `scale_color_brewer` ...
### from the `RColorBrewer` package
`scale_color_brewer(palette = "<palette name>")` ... note: 函数属于 ggplot2
### from the `viridis` package
`scale_color_viridis( discrete=TRUE, option="<palette name>" )` note: 提供了函数和palette
### other packages ...
* `paletteer` package: `scale_color_paletteer_xx` functions
* `ggsci` package
## ``` ggsci ```: palette for scientific journals!!!
\FontSmall
### install
```{r eval=FALSE}
install.packages("ggsci"); # Install ggsci from CRAN:
devtools::install_github("nanxstats/ggsci"); # or from github
```
### contents
``` scale_color_<journal> ``` 和 ``` scale_fill_<journal> ``` functions and color palettes
### supported journals
* NPG `scale_color_npg()`, `scale_fill_npg()`
* AAAS, NEJM, Lancet, JAMA ...
## ggsci 举例
\FontSmall
```{r warning=FALSE, message=FALSE}
library("ggsci")
library("ggplot2")
library("gridExtra")
data("diamonds")
p1 <- ggplot(
subset(diamonds, carat >= 2.2),
aes(x = table, y = price, colour = cut)
) +
geom_point(alpha = 0.7) +
geom_smooth(method = "loess", alpha = 0.05, size = 1, span = 1) +
theme_bw() + labs( tag = "A" )
p2 <- ggplot(
subset(diamonds, carat > 2.2 & depth > 55 & depth < 70),
aes(x = depth, fill = cut)
) +
geom_histogram(colour = "black", binwidth = 1, position = "dodge") +
theme_bw() + labs( tag = "B" )
```
\FontNormal
**要点**
* ``` library(gridExtra) ```
## ggsci 结果, Nature Style !!
\FontSmall
```{r fig.width=10, fig.height=4}
p1_npg <- p1 + scale_color_npg()
p2_npg <- p2 + scale_fill_npg()
grid.arrange(p1_npg, p2_npg, ncol = 2)
```
## ggplot2 小结
\FontSmall
### layered grammer (图层语法) 的成分
* 图层 ( geom_xxx )
* scale ( scale_xxx )
* faceting ( facet_xxx )
* 坐标系统
### 图象类型
* 点图
* bars
* boxplots
### 其它重要内容(部分需要自学)
* colours
* theme
* 其它图像类型
* 图例(legends)和 坐标轴
* 图形注释和其它定制
# ggplot2 进阶 2 :如何在一张图中画多个panel?
## key requirements for multi-panel plots
* order / position
* labeling
* layout
## faceting ...
Faceting generates small multiples each showing a different subset of the data.
``` facet_grid( <by_row> ~ <by_col> ) ``` 汽缸、车重与燃油效率间的关系
\FontSmall
```{r fig.height=3, fig.width=10}
ggplot( mtcars, aes( x = wt, y = mpg ) ) +
geom_point() +
facet_grid( . ~ cyl, scales = "free" );
```
## faceting , cont.
by col: 请自行尝试~
\FontSmall
```{r eval=FALSE}
ggplot( mtcars, aes( x = wt, y = mpg ) ) +
geom_point() +
facet_grid( cyl ~ . );
```
** 注意 **
作图相关概念: panel, strip, axis, tick, tick label, axis label
## ``` facet_grid ``` , cont.
\FontSmall
```{r fig.height=4, fig.width=10}
ggplot( mtcars, aes( x = wt, y = mpg ) ) +
geom_point() + geom_smooth( method = "lm" ) +
facet_grid( . ~ cyl );
```
## ``` facet_wrap ```
指定行、列数和方向
\FontSmall
```{r fig.height=4, fig.width=10}
ggplot( mtcars, aes( x = wt, y = mpg ) ) +
geom_point() + geom_smooth( method = "lm" ) +
facet_wrap( . ~ cyl , ncol = 2, dir = "v" );
```
## parameters of `facet_wrap`
\FontSmall
```{r eval=FALSE}
facet_wrap(
facets,
nrow = NULL,
ncol = NULL,
scales = "fixed",
shrink = TRUE,
labeller = "label_value",
as.table = TRUE,
switch = NULL,
drop = TRUE,
dir = "h",
strip.position = "top"
)
```
## combine multiple plots
Useful packages:
* `gridExtra`
* `cowplot`
* `grid`
* `lattice`
\FontSmall
install or load packages
```{r}
if (!require("gridExtra")){
install.packages("gridExtra");
}
if (!require("cowplot")){
install.packages("cowplot");
}
library( cowplot );
library( gridExtra );
```
## arranging multiple graphs using cowplot
Prepare two plots