本节函数都来自于dplyr包,都可以和group_by
函数联合起来处理复杂的数据。
filter
filter()
函数用来根据列的具体数据选择行。
1 | > library(dplyr) |
arrange
arrange()
函数用来排列行的顺序。
1 | > arrange(mpg,year,cty, hwy) #根据year,cty, hwy进行行排序 |
select
select()
函数用来选择列。
1 | > select(mpg,year,cty, hwy) #只显示year,cty, hwy三列 |
select()
函数的辅助函数:
start_with("abc")
:匹配以 “abc” 开头的变量名。ends_with("xyz")
:以 “xyz” 结尾。contains("ijk")
:包含 “ijk”。match("(.)\\\1")
:正则匹配重复字符。num_range("x",1:3)
:匹配x1,x2和x3。
rename
rename()
用来改变变量名。
1 | > rename(mpg,YEAR=year) #将year重命名YEAR |
mutate
mutate()
函数用来对数据进行增加新列。
1 | > mutate(mpg,cty2=cty*2) #数值型 |