티스토리 뷰
반응형
- 예시 데이터를 준비한다. (Parameter에 들어가는 데이터는 범주형이라고 생각하면 된다.)
1. fct_count(데이터, sort = F, prob = F)
- 각 levels의 갯수를 구해준다.
- sort = T라면 내림차순으로 정렬하여 반환하고,
- prob = T라면 전체 데이터 중 각 levels의 비율들을 구해준다.
2. fct_unique(데이터)
- unique() 함수와 똑같이 중복을 제외한 유일한 집합들을 보여준다.
- 차이점은 반환해줄 때, factor형으로 반환한다.
3. fct_c(데이터1, 데이터2)
- levels가 다른 두 개의 factor 데이터를 하나의 factor 데이터로 묶어준다.
- levels를 묶어주기 때문에 반드시 데이터는 factor형이어야 한다.
4. fct_unify(list(데이터1, 데이터2), levels = lvls_union(list(데이터1, 데이터2))
- fct_c와 비슷하게 levels의 합집합을 만들어 데이터를 묶어주며, default값은 두 개의 levels의 합집합이다.
- 차이점은 데이터들은 합치는 것이 아닌 리스트 형태로 levels 합집합만 적용한 채 따로 둔다.
5. fct_relevel(데이터, 원하는 levels 순서)
- 원하는 levels의 순서로 정렬한다.
6. fct_infreq / fct_inorder(데이터, ordered = NA)
- fct_infreq : factor의 갯수별로 내림차순으로 정렬한다.
- fct_inorder : 처음 등장한 순서대로 levels를 정렬한다.
- ordered = T라면 levels에 '<'를 표시해준다.
7. fct_rev(데이터)
- 현재의 levels 순서를 역으로 뒤집는다.
8. fct_shift(데이터, n = 1)
- levels의 순서를 이동하는 함수, n은 칸 수를 의미하며, default 값은 1이다.
- n > 0 - 왼쪽으로 n칸만큼 전체적으로 이동한다. 끝부분에 도달한 levels는 반대쪽인 제일 오른쪽으로 이동한다.
- n < 0 - 오른쪽으로 n칸만큼 전체적으로 이동한다. 끝부분에 도달한 levels는 반대쪽인 제일 왼쪽으로 이동한다.
9. fct_reorder(범주형 데이터, 데이터, .fun, .desc = F)
fct_reorder2(범주형 데이터, 데이터1, 데이터2, .fun, .desc = F)
- fct_reorder2
10. fct_recode(데이터, 변경할 levels ...)
fct_relabel(데이터, 변경할 level name)
- 두 함수 모두 levels의 이름을 변경하는 것이지만, 변경하는 방법에서 약간 차이가 있다고 생각한다.
- fct_recode는 levels의 이름을 아예 다른 것으로 변경하는 것이지만,
- fct_relabel은 기존 levels의 이름에 추가로 덧붙이거나 일부 문자를 변경하는 것이라고 생각한다.
11. fct_anon(f, prefix = "")
- Anonymize (익명화하다) 라는 뜻으로, Random한 숫자들로 levels를 바꾼다.
- prefix parameter를 통해서 숫자 앞부분에 원하는 문자를 덧 붙일 수 있다.
- default prefix 값은 아무것도 없으며, 숫자로만 변경한다.
12. fct_collapse(f, level 이름 = c(기존 levels))
- 기존에 있는 levels를 collapse (붕괴시키다) 라고 생각하면 된다.
- 아래의 예시에서 a, b, c의 levels에서 a와 b를 no로 합치는 것이다.
13. fct_lump(범주형 데이터, n, other_level = "Other", ties.method = "")
- 많이 나오는 순서에 따라 위에서부터 n 숫자만큼 남겨놓고 나머지 levels는 other_level parameter에 들어간 level로 묶어준다.
- forcats package에 들어있는 예시 데이터를 이용한다.
- 위의 PieChart 중 응답비율이 낮은 factor 3개를 한 개로 묶는다.
14. fct_other(데이터, keep, drop, other_level = "Other")
- fct_lump와 마찬가지로 levels를 합치는 기능을 제공하지만 사용하는 방법이 조금 다르다.
- Parameter 'keep'을 통해 계속 가지고 있을 levels를 넣을 수 있고,
- Parameter 'drop'을 통해 통합할 levels를 정할 수 있다.
15. fct_drop(데이터)
- 사용되지 않은 level을 버린다.
16. fct_expand(데이터, 추가할 levels ...)
- levels의 종류를 늘려준다.
17. fct_explicit_na(데이터, na_level = "(Missing)")
- levels에 보이지 않는 결측치 NA를 표시하기 위한 함수이다.
- Parameter na_level을 통해 원하는 문자열로 NA를 levels에 포함시킬 수 있다.
반응형
'Programming Language > R' 카테고리의 다른 글
stringr (0) | 2019.09.01 |
---|---|
dplyr (0) | 2019.07.11 |
tidyr (0) | 2019.07.10 |
댓글