beginner/파이썬 기초
NLTK 토큰화, 태그
johh
2019. 5. 19. 01:58
In [1]:
import nltk
In [2]:
!pip3 show nltk
In [3]:
sentence = """At eight o'clock on Thursday morning Arthur didn't feel very good."""
nltk의 punkt 다운로드¶
안깔고 토큰화 하면 punkt를 깔라는 오류가 뜬다. 아나콘다 환경이 아닐시 안되면 https://programmers.co.kr/learn/courses/21/lessons/946#note 보고 따라할 것
In [5]:
nltk.download('punkt')
Out[5]:
sentence 토큰화¶
In [6]:
tokens = nltk.word_tokenize(sentence)
tokens
Out[6]:
nltk의 averaged_perceptron_tagger 다운로드¶
안깔고 태깅하면 averaged_perceptron_tagger를 깔라는 오류가 뜬다. 안되면 https://programmers.co.kr/learn/courses/21/lessons/946#note 보고 따라할 것
In [8]:
nltk.download('averaged_perceptron_tagger')
Out[8]:
pog_tag로 테깅하기¶
In [10]:
tagged = nltk.pos_tag(tokens)
tagged
Out[10]: