텍스트 분류
Last updated
Last updated
텍스트 분류는 아마 현업에서 가장 수요가 많은 문제일 것입니다. 우리는 텍스트 분류를 통해 스팸 메일을 필터링하고, 사용자의 리뷰 분석을 통해 제품을 평가하며, 게시물의 카테고리를 분류하는 등의 다양한 문제를 해결할 수 있습니다. 이를 위해서는 시퀀셜 데이터인 문장을 입력받아 어떤 하나의 벡터로 나타내는 작업이 필요합니다. 즉, 여러 time-step에 걸친 시퀀셜 데이터인 문장을 하나의 벡터로 차원 축소할 수 있어야 합니다.
8장에서는 앞서 다룬 RNN을 비롯해 합성곱 신경망(CNN) 등 다양한 방법을 통해 텍스트를 분류하는 법을 배웁니다. 또한 실제 텍스트 분류를 위한 방법들을 파이토치 예제 코드를 통해 살펴보겠습니다.