本节函数都来自于dplyr包,都可以和group_by函数联合起来处理复杂的数据。
filter
filter()函数用来根据列的具体数据选择行。
1 | > library(dplyr) |
arrange
arrange()函数用来排列行的顺序。
1 | > arrange(mpg,year,cty, hwy) #根据year,cty, hwy进行行排序 |
select
select()函数用来选择列。
1 | > select(mpg,year,cty, hwy) #只显示year,cty, hwy三列 |
select()函数的辅助函数:
start_with("abc"):匹配以 “abc” 开头的变量名。ends_with("xyz"):以 “xyz” 结尾。contains("ijk"):包含 “ijk”。match("(.)\\\1"):正则匹配重复字符。num_range("x",1:3):匹配x1,x2和x3。
rename
rename()用来改变变量名。
1 | > rename(mpg,YEAR=year) #将year重命名YEAR |
mutate
mutate()函数用来对数据进行增加新列。
1 | > mutate(mpg,cty2=cty*2) #数值型 |