예시 데이터는 fruit를 사용한다. 1. str_detect(string, pattern) string 문자열내에 pattern의 위치에 상관없이 존재하는지의 여부를 알려준다. 2. str_which(string, pattern) str_detect와 달리 pattern이 있는 string의 index를 반환한다. (문자열 내부 index는 str_locate) 3. str_locate(string, pattern) str_which가 pattern을 포함하는 string의 index를 알려주는 것이라면 str_locate는 string 문자열 내우베엇 pattern이 시작되고 끝나는 index를 반환한다. 4. str_count(string, pattern) string 문자열 내 pattern의 개..
예시 데이터를 준비한다. (Parameter에 들어가는 데이터는 범주형이라고 생각하면 된다.) 1. fct_count(데이터, sort = F, prob = F) 각 levels의 갯수를 구해준다. sort = T라면 내림차순으로 정렬하여 반환하고, prob = T라면 전체 데이터 중 각 levels의 비율들을 구해준다. 2. fct_unique(데이터) unique() 함수와 똑같이 중복을 제외한 유일한 집합들을 보여준다. 차이점은 반환해줄 때, factor형으로 반환한다. 3. fct_c(데이터1, 데이터2) levels가 다른 두 개의 factor 데이터를 하나의 factor 데이터로 묶어준다. levels를 묶어주기 때문에 반드시 데이터는 factor형이어야 한다. 4. fct_unify(list..
예시 데이터는 dplyr 패키지에 있는 'starwars' 데이터를 이용한다. 데이터 구조를 보자. 구조를 한 눈에 보기 위해서 일부 열들을 제거한다. 1. pull(데이터, 추출할 column) 선택한 column의 값들을 vector로 반환해준다. 2. select(데이터, 추출할 column) pull과 기능은 비슷하다. 차이점은 반환하는 데이터 형태로 select는 data.frame으로 반환한다. 3. pull과 select와 함께 쓰면 좋은 함수들 3-1. starts_with(문자열), ends_with(문자열) starts_with는 paramter로 전달한 문자열로 시작하는 column들을 반환한다. ends_with는 start_with와 반대로 parameter 문자열로 끝나는 col..
0. 예시 데이터 생성 1. gather(데이터, key, value, 열1, 열2, ..., fill = NA) Column을 Row로 모은다고 생각하면 이해하기 쉽다. key = column 이름, value = column 값. 데이터에서 key와 value column들을 생성하며, key 위치에는 parameter 열의 이름 / value 위치에는 해당 열의 값들을 입력한다. fill은 NA 값이 존재 할 경우 어떠한 값으로 채울지 결정하는 parameter. 예제로 보면 'column 이름을 모으는 column'은 stock, 'column 값을 모으는 column'은 price, '모이는 column'은 X, Y, Z이다. -time 같은 경우는 모든 column들 중 time column만..