서문

독자분들에게

2016년 알파고의 활약에 힘입어 대한민국에도 인공지능의 열풍이 불기 시작하였습니다. 저 또한 그 바람에 힘입어 열심히 딥러닝 공부를 하게 되었습니다. 다행히 요즘과 같은 시대에는 꼭 대학교나 대학원이 아니더라도 공부할 수 있는 방법들이 정말 많이 있습니다. 유튜브와 같은 매체부터, ArXiv와 같이 무료로 논문을 공개하는 저장소, 깃허브를 필두로 한 오픈소스 문화까지, 너무나도 많은 자료들이 오히려 범람하는 시대 입니다. 하지만 이러한 정보의 홍수 속에서도 자연어처리는 그 필요성에 비해서 자료가 여전히 부족했던 것이 사실입니다. MNIST를 필두로 굉장히 쉽게 접할 수 있는 영상처리(computer vision) 분야에 비해서, 자연어처리는 조금만 세부적으로 파고 들어가면 자료가 전무하다시피 하고, 있더라도 단편적으로 흩어져 있을 수 밖에 없습니다. 저도 이리저리 온라인에 단편적으로 흩어져 있는 자료들을 공부하다보니, 체계가 없이 기초가 부족하여 큰 어려움을 겪었던 경험이 있습니다.

이 책은 한국어의 특성에 따른 자연어처리 뿐만 아니라, 자연어처리 및 생성에 대한 큰 부분을 체계적으로 아우르고자 한 책 입니다. 자연어처리 분야는 단순히 머신러닝의 한 줄기가 아니라 사람이 사용하는 언어에 대한 학문이기도 합니다. 따라서 딥러닝에 집중하여 자연어처리 분야에 접근하기보단, 기초 토대부터 체계적으로 접근하는 것이 필요하다고 생각 됩니다. 예를 들어, 비록 딥러닝이 언어에 상관없이 같은 알고리즘을 적용하려 하지만, 언어마다 그 특성이 다르기 때문에 전처리에서부터 딥러닝 알고리즘에 녹아있는 기초 토대는 결국 자연어처리 도메인의 특성을 따르게 되고, 그 특성 또한 언어에 따라서 달라지기 마련입니다. 따라서 학교에 다니지 않는 이상 체계적으로 자연어처리 분야에 대해서 공부하는 것은 여전히 어렵습니다. 저도 어려움을 느꼈기에, 이러한 점들이 여전히 처음 자연어처리를 시작하고자 하는 분들에게 큰 장벽으로 작용할 것이라 생각합니다. 따라서 저는 예전의 저에게 들려주고 싶은 내용들로 이 책을 구성하려 했습니다.

또한 단지 딥러닝 기술 자체에만 집중하여 자연어처리 분야에 대한 직관 및 개념 전달을 소홀히 하게 되는 것을 지양하고자 하였고, 그동안 실무에서 실제 기술들을 적용하며 느껴왔던 인사이트들을 공유하고자 하였습니다. 또한 기존 딥러닝에 대한 시각에서처럼 단순히 back-propagation 등의 미적분과 선형대수에 집중하는 것을 떠나서, 좀 더 통계적인 시각에서 바라볼 수 있도록 하고자 하였습니다. 따라서 이 책에서는 기존에 온라인이나 다른 저서에서 쉽게 접할 수 있는 역전파 알고리즘이나 기타 딥러닝에 대한 기초 지식들을 서술하기 보단, 쉽게 접할 수 없던 뒷 내용들에 대해서 좀 더 독자들에게 이야기 하고 싶었습니다. 따라서 현재 딥러닝을 활용한 최신 기술 뿐만 아니라, 딥러닝 이전의 기존의 전통적인 방식부터 차근차근 설명하여, 왜 이 기술이 필요하고, 어떻게 발전 해 왔으며, 어떤 부분이 성능 개선을 만들어냈는지 쉽게 이해할 수 있도록 설명하고자 합니다.

혹시 수식이 낯설은 입문자 분들은 수식은 좀 더 과감히 건너뛰고 읽으셔도 좋습니다. 하지만 한 발 더 나아가고 싶은 독자분들은 꼭 다시 돌아와서 수식을 다시 이해하려 노력 해주시기 바랍니다. 먼저 한번 읽은 후에 큰 그림을 이해하고 다시 읽으며 수식을 이해하면 좀 더 좋을 것 같습니다.

고마운이들에게

먼저 자언어처리에 대한 지식과 경험을 쌓을 수 있도록 많은 가르침을 주셨던 한국전자통신연구원 자동통역연구실 동료분들에게 감사하고 싶습니다. 더 나은곳으로 갈 수 있는 훌륭한 발판을 만들어주셨다고 생각합니다. 그리고 가장 중요한 시기에 가장 재미있게 일하고 배울 수 있도록 최고의 환경을 만들어준 SK플래닛 머신인텔리전스 랩 팀원들, 기초가 부족한 저에게 좋은 지식과 인사이트를 전달 해 단기간에 다시 한번 큰 성장을 하도록 이끌어준 마키나락스의 직원들에게 감사의 인사를 하고 싶습니다. 덕분에 여기까지 올 수 있었다고 생각 합니다. 또한 부족한 저를 믿고 좋은 강의 기회를 주셨던 패스트캠퍼스와 이샘 매니저님에게도 감사를 전합니다.

마지막으로 평일 저녁, 주말마다 바쁘다는 핑계로 가족과 함께하는 시간을 많이 갖지 못하는 부족한 가장인 저를 이해하고 응원해준 나의 아내 이승영과 딸 김지우에게 이 책을 바칩니다.

2019.02

2018년 3월 일본에서