In [1]: import nltk In [2]: !pip3 show nltk Name: nltk Version: 3.4.1 Summary: Natural Language Toolkit Home-page: http://nltk.org/ Author: Steven Bird Author-email: stevenbird1@gmail.com License: Apache License, Version 2.0 Location: c:\users\whanh\appdata\local\continuum\anaconda3\lib\site-packages Requires: six Required-by: In [3]: sentence = """At eight o'clock on Thursday morning Arthur..
클래스란?¶ 객체지향은 프로그래밍의 꽃이다. 클래스는 객체지향을 구현함에 있어 중요한 부분이다. 클래스는 비슷한 속성을 가진 객체를 묶는 큰 틀이라고 생각하면 된다. 클래스 변수¶ In [1]: class Customer: welcome = '반갑습니다' 클래스 Customer는 '반갑습니다'라는 값을 가진 welcome 라는 변수를 가지고 있다. 이를 호출하려고 하면 해당 클래스의 인스턴트를 통해서만 가능하다. In [2]: Customer.welcome Out[2]: '반갑습니다' 클래스 함수¶ In [5]: class Customer: def info(self, id): print("id : %d" % id) new_Customer = Customer() new_Cust..
스택 & 큐¶ 스택(stack)¶ 나중에 넣은 데이터를 먼저 반환하도록 설계된 메모리 구조로 Last In First Out (LIFO)로 구현됨 Data의 입력을 Push, 출력을 Pop라 한다. exmaple1 In [1]: a = [1,2,3,4,5] 리스트 a에 10을 넣자 In [2]: a.append(10) 리스트 a에 20을 넣자 In [3]: a.append(20) 리스트 a에서 마지막에 넣은 값을 출력하자 In [5]: a.pop() Out[5]: 20 리스트 a에서 마지막에 넣은 값을 출력하자 In [6]: a.pop() Out[6]: 10 example2 In [8]: word = input('Input a word: ') world_list = list(word) fo..
In [3]: import pandas as pd from mlxtend.preprocessing import TransactionEncoder from mlxtend.frequent_patterns import apriori In [4]: dataset= [['양말','팬티','신발'], ['신발','바지','팬티','셔츠'], ['모자','양말','신발'], ['신발','바지','팬티','장갑']] In [6]: t = TransactionEncoder() t_a = t.fit(dataset).trans..
matplotlib¶ 시각화의 중요성과 matplotlib¶ 인간은 가장 시각 능력이 뛰어난 동물 중의 하나이다. 하지만 인간의 수치 계산 능력은 본능이 아니다. (언어의 발달로 인한 논리 능력의 확장임) 이런 점들이 인간이 아직까지 인공지능에 비해 시각적 판단이 뛰어난 이유이다. 시각 능력은 다른 말로 하면 패턴인식 능력이다. 빛의 분포로 생기는 시각 패턴을 인간은 너무나 쉽게 알아 볼 수 있다. 이러한 인간의 능력을 최대한 발휘하기 위해서 숫자로 되어 있는 데이터를 시각화 하여야 한다. 제공받은 데이터의 특성을 분석하기 위해서 뿐만 아니라, 결과를 설명하기 위해서 시각화는 아주 중요하다. matplotlib 는 파이썬의 시각화 도구이다. matplotlib 는 MATLAB 의 시각화 기능을 참고하여 ..
Numpy¶기타 기능들¶ a.T, np.transpose() np.dot(), np.matmul(), @ np.meshgrid() np.any(), np.all() np.unique() np.ravel(), 차원증가, np.squeeze(), np.expand_dims(), np.newaxis np.r[], np.c[] np.vectorize() In [2]: import numpy as np import matplotlib.pyplot as plt In [3]: a = np.array([[1,2],[3,4]]) In [4]: a.T Out[4]: array([[1, 3], [2, 4]]) In [5]: a = [1,2,1,2,3,1,2,3,4] np.unique(a) Out[5]: array([1, 2..
2019.02,18 구간나누기¶ np.arange() # a부터 b까지 c단위로 나눈다. np.linspace() # 구간을 나눈다. ex 히스토그램 np.bincount() # 구간을 나눠서 개수를 셈 ex) 140~150은 1명 150~160은 3명 160~170은 5명 170~180은 7명 180~190은 4명 np.digitize() # 구간을 나눠서 mapping 시킴 ex) 143, 142는 0, 152, 155, 156은 1, .... np.histogram() => plt.hist() In [12]: import numpy as np import matplotlib.pyplot as plt In [15]: np.arange(-1,1,0.1) # 1 대신 1과 1.1 사이의 어떤 값을 집어넣..
연습문제¶ 기후 데이터를 불러와서 날자 부분을 [연도, 달, 일]로 분리하라. In [2]: s = '지점,일시,평균기온(°C),최저기온(°C),최저기온 시각(hhmi),최고기온(°C),최고기온 시각(hhmi),강수 계속시간(hr),10분 최다 강수량(mm),10분 최다강수량 시각(hhmi),1시간 최다강수량(mm),1시간 최다 강수량 시각(hhmi),일강수량(mm),최대 순간 풍속(m/s),최대 순간 풍속 풍향(16방위),최대 순간풍속 시각(hhmi),최대 풍속(m/s),최대 풍속 풍향(16방위),최대 풍속 시각(hhmi),평균 풍속(m/s),풍정합(100m),평균 이슬점온도(°C),최소 상대습도(%),최소 상대습도 시각(hhmi),평균 상대습도(%),평균 증기압(hPa),평균 현지기압(hPa)..