티스토리 뷰

Programming Language/R

forcats

기내식은수박바 2019. 7. 15. 16:50
반응형
  • 예시 데이터를 준비한다. (Parameter에 들어가는 데이터는 범주형이라고 생각하면 된다.)

 

1. fct_count(데이터, sort = F, prob = F)

  • 각 levels의 갯수를 구해준다.
  • sort = T라면 내림차순으로 정렬하여 반환하고,
  • prob = T라면 전체 데이터 중 각 levels의 비율들을 구해준다.

 

2. fct_unique(데이터)

  • unique() 함수와 똑같이 중복을 제외한 유일한 집합들을 보여준다.
  • 차이점은 반환해줄 때, factor형으로 반환한다.

 

3. fct_c(데이터1, 데이터2)

  • levels가 다른 두 개의 factor 데이터를 하나의 factor 데이터로 묶어준다.
  • levels를 묶어주기 때문에 반드시 데이터는 factor형이어야 한다.

 

4. fct_unify(list(데이터1, 데이터2), levels = lvls_union(list(데이터1, 데이터2))

  • fct_c와 비슷하게 levels의 합집합을 만들어 데이터를 묶어주며, default값은 두 개의 levels의 합집합이다.
  • 차이점은 데이터들은 합치는 것이 아닌 리스트 형태로 levels 합집합만 적용한 채 따로 둔다.

 

5. fct_relevel(데이터, 원하는 levels 순서)

  • 원하는 levels의 순서로 정렬한다.

 

6. fct_infreq / fct_inorder(데이터, ordered = NA)

  • fct_infreq : factor의 갯수별로 내림차순으로 정렬한다. 
  • fct_inorder : 처음 등장한 순서대로 levels를 정렬한다.
  • ordered = T라면 levels에 '<'를 표시해준다.

 

7. fct_rev(데이터)

  • 현재의 levels 순서를 역으로 뒤집는다.

 

8. fct_shift(데이터, n = 1)

  • levels의 순서를 이동하는 함수, n은 칸 수를 의미하며, default 값은 1이다.
  • n > 0 - 왼쪽으로 n칸만큼 전체적으로 이동한다. 끝부분에 도달한 levels는 반대쪽인 제일 오른쪽으로 이동한다.
  • n < 0 - 오른쪽으로 n칸만큼 전체적으로 이동한다. 끝부분에 도달한 levels는 반대쪽인 제일 왼쪽으로 이동한다.

 

9. fct_reorder(범주형 데이터, 데이터, .fun, .desc = F)

    fct_reorder2(범주형 데이터, 데이터1, 데이터2, .fun, .desc = F)

- fct_reorder2

 

10. fct_recode(데이터, 변경할 levels ...)

      fct_relabel(데이터, 변경할 level name)

  • 두 함수 모두 levels의 이름을 변경하는 것이지만, 변경하는 방법에서 약간 차이가 있다고 생각한다.
  • fct_recode는 levels의 이름을 아예 다른 것으로 변경하는 것이지만,
  • fct_relabel은 기존 levels의 이름에 추가로 덧붙이거나 일부 문자를 변경하는 것이라고 생각한다.

 

11. fct_anon(f, prefix = "")

  • Anonymize (익명화하다) 라는 뜻으로, Random한 숫자들로 levels를 바꾼다.
  • prefix parameter를 통해서 숫자 앞부분에 원하는 문자를 덧 붙일 수 있다.
  • default prefix 값은 아무것도 없으며, 숫자로만 변경한다.

 

12. fct_collapse(f, level 이름 = c(기존 levels))

  • 기존에 있는 levels를 collapse (붕괴시키다) 라고 생각하면 된다.
  • 아래의 예시에서 a, b, c의 levels에서 a와 b를 no로 합치는 것이다.

 

13. fct_lump(범주형 데이터, n, other_level = "Other", ties.method = "")

  • 많이 나오는 순서에 따라 위에서부터 n 숫자만큼 남겨놓고 나머지 levels는 other_level parameter에 들어간 level로 묶어준다.
  • forcats package에 들어있는 예시 데이터를 이용한다.

  • 위의 PieChart 중 응답비율이 낮은 factor 3개를 한 개로 묶는다.

 

14. fct_other(데이터, keep, drop, other_level = "Other")

  • fct_lump와 마찬가지로 levels를 합치는 기능을 제공하지만 사용하는 방법이 조금 다르다.
  • Parameter 'keep'을 통해 계속 가지고 있을 levels를 넣을 수 있고,
  • Parameter 'drop'을 통해 통합할 levels를 정할 수 있다.

 

15. fct_drop(데이터)

  • 사용되지 않은 level을 버린다.

 

16. fct_expand(데이터, 추가할 levels ...)

  • levels의 종류를 늘려준다.

 

17. fct_explicit_na(데이터, na_level = "(Missing)")

  • levels에 보이지 않는 결측치 NA를 표시하기 위한 함수이다.
  • Parameter na_level을 통해 원하는 문자열로 NA를 levels에 포함시킬 수 있다.

반응형

'Programming Language > R' 카테고리의 다른 글

stringr  (0) 2019.09.01
dplyr  (0) 2019.07.11
tidyr  (0) 2019.07.10
댓글
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
more
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함