Natural Language Processing with PyTorch
  • 소개글
  • 서문
  • Index
  • 딥러닝을 활용한 자연어 처리 개요
    • 자연어 처리란 무엇일까?
    • 딥러닝 소개
    • 왜 자연어 처리는 어려울까?
    • 무엇이 한국어 자연어 처리를 더욱 어렵게 만들까?
    • 자연어 처리의 최근 추세
  • 기초 수학
    • 서문
    • 랜덤 변수와 확률 분포
    • 쉬어가기: 몬티 홀 문제
    • 기대값과 샘플링
    • Maximum Likelihood Estimation
    • 정보 이론
    • 쉬어가기: MSE 손실 함수와 확률 분포 함수
    • 마치며
  • Hello 파이토치
    • 딥러닝을 시작하기 전에
    • 설치 방법
    • 짧은 튜토리얼
    • 쉬어가기: 윈도우즈 개발 환경 구축
  • 전처리
    • 전처리란
    • 코퍼스 수집
    • 코퍼스 정제
    • 분절
    • 병렬 코퍼스 정렬
    • 서브워드 분절
    • 분절 복원
    • 토치텍스트
  • 유사성과 모호성
    • 단어의 의미
    • One-hot 인코딩
    • 시소러스를 활용한 단어 의미 파악
    • 특징
    • 특징 추출하기: TF-IDF
    • 특징 벡터 만들기
    • 특징 유사도 구하기
    • 단어 중의성 해소
    • Selectional Preference
    • 마치며
  • 단어 임베딩
    • 들어가며
    • 차원 축소
    • 흔한 오해 1
    • Word2Vec
    • GloVe
    • Word2Vec 예제
    • 마치며
  • 시퀀스 모델링
    • 들어가며
    • Recurrent Neural Network
    • Long Short Term Memory
    • Gated Recurrent Unit
    • 그래디언트 클리핑
    • 마치며
  • 텍스트 분류
    • 들어가기
    • 나이브 베이즈를 활용하기
    • 흔한 오해 2
    • RNN을 활용하기
    • CNN을 활용하기
    • 쉬어가기: 멀티 레이블 분류
    • 마치며
  • 언어 모델링
    • 들어가며
    • n-gram
    • 언어 모델의 평가 방법
    • SRILM을 활용한 n-gram 실습
    • NNLM
    • 언어 모델의 활용
    • 마치며
  • 신경망 기계번역
    • 들어가며
    • Sequence-to-Sequence
    • Attention
    • Input Feeding
    • 자기회귀 속성과 Teacher Forcing 훈련 방법
    • 탐색(추론)
    • 성능 평가
    • 마치며
  • 신경망 기계번역 심화 주제
    • 다국어 신경망 번역
    • 단일 언어 코퍼스를 활용하기
    • 트랜스포머
    • 마치며
  • 강화학습을 활용한 자연어 생성
    • 들어가며
    • 강화학습 기초
    • 정책 기반 강화학습
    • 자연어 생성에 강화학습 적용하기
    • 강화학습을 활용한 지도학습
    • 강화학습을 활용한 비지도학습
    • 마치며
  • 듀얼리티 활용
    • 들어가며
    • 듀얼리티를 활용한 지도학습
    • 듀얼리티를 활용한 비지도학습
    • 쉬어가기: Back-translation을 재해석하기
    • 마치며
  • NMT 시스템 구축
    • 파이프라인
    • 구글의 NMT
    • 에딘버러 대학의 NMT
    • MS의 NMT
  • 전이학습
    • 전이학습이란?
    • 기존의 사전 훈련 방식
    • ELMo
    • BERT
    • GPT-2
    • XLNet
    • 마치며
  • 이 책을 마치며
  • 참고문헌
Powered by GitBook
On this page
  • 아나콘다 설치
  • 파이토치 설치
  • 깃 설치
  1. Hello 파이토치

쉬어가기: 윈도우즈 개발 환경 구축

Previous짧은 튜토리얼Next전처리

Last updated 5 years ago

이 책은 맥 또는 리눅스 기준으로 쓰여진 부분이 많기 때문에, 이번 섹션에서는 윈도우즈에서 개발 환경 구축하는 방법을 다루도록 하겠습니다.

아나콘다 설치

아나콘다를 통해 파이썬을 설치 합니다. 3.6 버전 이상을 설치 할 것을 권장 합니다.

  • URL:

위의 사이트에서 자신의 환경에 맞는 설치 파일을 다운 받아 실행 합니다. 아래와 같이 여러가지 버전과 환경에 관한 설치 파일을 다운 받을 수 있습니다. 필자는 3.7버전 64비트 설치를 진행 합니다.

그럼 아래와 같이 아나콘다 설치 프로그램이 설치를 진행 합니다.

아나콘다 설치가 끝나면 시작프로그램에서 설치가 제대로 되었음을 확인할 수 있습니다. 사용자는 필요에 따라 Anaconda Prompt를 실행하거나 Jupyter Notebook을 실행할 수 있습니다. 이 책의 전반부는 Jupyter Notebook을 통해 실습을 진행할 수 있으며, 후반부는 코드와 프로젝트가 커짐에 따라 적절한 파이썬 IDE<저자주> 저자는 마이크로소프트 VSCode를 애용합니다. </저자주>를 활용하여 파이썬 스크립트를 편집 및 실행 할 수 있습니다.

파이토치 설치

파이토치 설치를 위하여 파이토치 웹사이트에 접속합니다.

아래와 같이 웹사이트 상에서 파이토치 설치를 위한 자신의 환경 설정을 적절히 선택하면, 밑에 파이토치 설치를 할 수 있는 명령어가 나타납니다. 필자의 경우에는 Stable 버전과 윈도우즈 OS, Conda, Python 3.7을 선택한 것을 볼 수 있습니다. 특히, 자신의 GPU 사용 여부에따라 CUDA 항목을 잘 선택하기 바랍니다. 필자는 None을 선택하여 CPU 버전의 파이토치를 설치하고자 합니다.

해당 명령어를 복사하여 Anaconda Prompt를 실행하여 붙여넣고 설치를 시작합니다.

그럼 아나콘다는 의존성 파악을 한 후, 파이토치와 함께 다음과 같은 추가 패키지를 설치 할 것임을 물어봅니다.

설치가 완료되면 iPython 또는 Jupyter Notebook을 실행하여 파이토치를 import하여 제대로 설치 되었는지 확인합니다. 파이토치는 아래와 같이 torch라는 패키지를 import하여 사용할 수 있습니다.

import torch

깃 설치

필자의 깃허브 레포지토리를 복사하기 위하여 깃(git) 설치를 진행합니다. 윈도우즈의 경우에는 아래와 같이 Git SCM 프로그램을 설치하여 깃을 사용할 수 있습니다. 웹사이트 주소는 아래와 같습니다.

웹사이트에서 설치 파일을 받아 실행하면 아래와 같이 프로그램이 실행되며 설치를 진행할 수 있습니다.

또는 아래와 같이 깃허브 레포지토리 웹사이트에서 직접 zip 압축파일 형태로 다운받아 사용할 수도 있습니다.

URL:

URL:

https://pytorch.org/
https://git-scm.com/
https://www.anaconda.com/distribution/#windows
자신에게 맞는 환경을 선택하여 아나콘다 설치 파일을 다운로드 합니다.
아나콘다 설치를 진행 합니다.
파이토치 웹사이트에서 자신에게 맞는 설정을 선택하여 설치 명령을 복사합니다.
Anaconda Prompt를 실행하여 명령어를 붙여넣기 합니다.
설치를 진행 합니다.
ipython을 실행하여 torch를 import하여 설치가 제대로 되었음을 확인합니다.
웹사이트에 접속하면 화면 오른쪽에 사용자의 환경에 알맞는 다운로드 링크가 제공되고 있습니다.
깃 설치를 진행합니다.
'Clone as download' 파일을 선택하여 'Download ZIP'을 선택 합니다.