텍스트 분류는 아마 현업에서 가장 수요가 많은 문제일 것입니다. 우리는 텍스트 분류를 통해 스팸 메일을 필터링하고, 사용자의 리뷰 분석을 통해 제품을 평가하며, 게시물의 카테고리를 분류하는 등의 다양한 문제를 해결할 수 있습니다. 이를 위해서는 시퀀셜 데이터인 문장을 입력받아 어떤 하나의 벡터로 나타내는 작업이 필요합니다. 즉, 여러 time-step에 걸친 시퀀셜 데이터인 문장을 하나의 벡터로 차원 축소할 수 있어야 합니다.
8장에서는 앞서 다룬 RNN을 비롯해 합성곱 신경망(CNN) 등 다양한 방법을 통해 텍스트를 분류하는 법을 배웁니다. 또한 실제 텍스트 분류를 위한 방법들을 파이토치 예제 코드를 통해 살펴보겠습니다.