EXCELSIOR

python3.5에 NLTK 설치하기 본문

NLP/NLTK

python3.5에 NLTK 설치하기

Excelsior-JH 2016. 12. 13. 19:28

NLTK 공부를 하기에 앞서 먼저 NLTK를 설치해 보겠다.

  1. Python에 NLTK를 설치하기 위해서는 먼저 Numpy를 설치해야 한다. Numpy 설치는 http://excelsior-cjh.tistory.com/entry/Python%EC%97%90-numpy-%EC%84%A4%EC%B9%98-%EB%B0%8F-%EC%8B%A4%ED%96%89 여기를 참고하자
  2. NLTK를 설치하기 위해 다음과 같이 pip 명령어를 입력한다.
pip install nltk

NLTK가 설치가 제대로 되었는지 확인해 본다. 다음과 같이 아무런 에러가 나지 않으면 제대로 설치된 것이다.


만약 다음과 같은 에러가 난다면 pip install numpy --upgrade  명령어를 통해 Numpy를 업그레이드 해주면 된다.

>>>import nltk
Traceback (most recent call last):
  File "D:/Users/WIPS/PycharmProjects/NLTK-study/Chap01_Tokenizing_and_WordNet.py", line 1, in 
    import nltk
  File "D:\Users\AppData\Local\Programs\Python\Python35\lib\site-packages\nltk\__init__.py", line 128, in 
    from nltk.chunk import *
  File "D:\Users\AppData\Local\Programs\Python\Python35\lib\site-packages\nltk\chunk\__init__.py", line 157, in 
    from nltk.chunk.api import ChunkParserI
  File "D:\Users\AppData\Local\Programs\Python\Python35\lib\site-packages\nltk\chunk\api.py", line 13, in 
    from nltk.parse import ParserI
  File "D:\Users\AppData\Local\Programs\Python\Python35\lib\site-packages\nltk\parse\__init__.py", line 79, in 
    from nltk.parse.transitionparser import TransitionParser
  File "D:\Users\AppData\Local\Programs\Python\Python35\lib\site-packages\nltk\parse\transitionparser.py", line 21, in 
    from sklearn.datasets import load_svmlight_file
  File "D:\Users\AppData\Local\Programs\Python\Python35\lib\site-packages\sklearn\__init__.py", line 57, in 
    from .base import clone
  File "D:\Users\AppData\Local\Programs\Python\Python35\lib\site-packages\sklearn\base.py", line 12, in 
    from .utils.fixes import signature
  File "D:\Users\AppData\Local\Programs\Python\Python35\lib\site-packages\sklearn\utils\__init__.py", line 11, in 
    from .validation import (as_float_array,
  File "D:\Users\AppData\Local\Programs\Python\Python35\lib\site-packages\sklearn\utils\validation.py", line 18, in 
    from ..utils.fixes import signature
  File "D:\Users\AppData\Local\Programs\Python\Python35\lib\site-packages\sklearn\utils\fixes.py", line 406, in 
    if np_version < (1, 12, 0):
TypeError: unorderable types: str() < int()


아직 NLTK 설치가 끝난 것이 아니다. NLTK를 import 시키고 난뒤 nltk.download()를 입력하면 다음과 같은 화면이 나타난다.

>>> import nltk
>>> nltk.download()


다운로드를 한 뒤 마지막으로 테스트 해본다.

>>> from nltk.corpus import brown
>>> brown.words()
['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', ...]

위와 같은 결과가 나오면 설치가 끝난 것이다. 


참고 사이트 : http://www.nltk.org/data.html

Comments