논문 https://www.sciencedirect.com/science/article/pii/S0020025518308028 Abstract 문서 분류의 목적은 가장 적절한 레이블을 지정된 문서에 할당하는 것임. 문서 분류에서 가장 중요한 과제는 불충분한 레이블 정보와 구조화 되지 않은 희소 (sparse) 형식임. 준지도 학습 (SSL, Semi-supervised learning) 접근은 불충분한 레이블 정보 문제에 효과적인 방법이 될 수 있는 반면, 여러 문서 표현 방법에 대한 고려는 구조화 되지 않은 희소 형식를 해결할 수 있음. Co-training은 동일한 예시에 대해 Feature Subset이라는 점에서 다양한 관점을 이용하려고 시도하는 유명한 SSL 방법임. 이 논문에서 우리는 문서 분..
#1 제대로 써 보는 첫 블로그 19년 3월 23일 토요일 오전 00시 59분. 문득 티스토리 회원가입을 할 때 초대장이 필요없다고 말해줬던 아는 형의 말이 번뜩 생각 나서 설레는 마음을 가지고 얼른 양치하고 와서 앉았다. 진짜로 필요가 없다 ... 작년 7월인가 8월즈음에 티스토리 블로그를 만들어서 내 공부 흔적들을 남겨보고 싶었지만 초대장 때문에 포기를 했다. 또 최근에는 깃허브로 블로그를 만들기는 했는데 테마가 적용이 안된다. 그래서 반 포기느낌. 첫 블로그의 첫 게시글이라 너무 흥분되서 일기를 쓰고 있다. 이론적인 공부는 티스토리에 남길 계획이다. #2 내가 블로그에 남기고 싶은 것들이 너무 많다. 약간 변태라 내 흔적들을 남기고 싶다. 몇년 전부터 공부하는게 취미가 된 극변태느낌. 나만의 공간을..