In [1]: a = "Life is too short, you need python" In [3]: if 'wife' in a: print('wife') elif 'python' in a and 'you' not in a: print('python') elif 'shirt' not in a: print('shirt') #여기서 결과값이 나왔으므로 뒤에 있는 참 거짓은 판별하지 않는다. elif 'need' in a: print('need') else: print('none') shirt In [ ]: # for문 ((조건)하는 동안에 ~해라.) In [ ]: #..
2019.1.30 조환희 In [ ]: #복습 In [6]: l=[] In [7]: l Out[7]: [] In [8]: l+=[1,2,3,] In [9]: l Out[9]: [1, 2, 3] In [10]: l.append(4) #l.append([4])를 하게 되면 l=(1,2,3,[4])가 되어버린다. In [11]: l Out[11]: [1, 2, 3, 4] In [12]: a=[3,2,5,1,4] In [13]: sorted(a) Out[13]: [1, 2, 3, 4, 5] In [18]: help(sorted) Help on built-in function sorted in module builtins: sorted(iterable, /, *, key=None, reverse=False) Re..
다중선형회귀분석 실습 1 In [18]: (1) Python package 로드 및 matplotlib 출력 옵션 설정 In [19]: # 사용할 패키지들을 불러와서 포함시키는 코드이다. # python package들을 가져오는 것과 matplotlib 출력 옵션 설정에 대한 내용이다. from sklearn import linear_model import numpy as np import pandas as pd import matplotlib import matplotlib.pyplot as plt %matplotlib inline matplotlib.style.use('ggplot') In [20]: (2) 데이터 생성 In [21]: data = {'x1' : [13, 18, 17, 20, 22,..
1.구글에서 구글 애널리틱스를 검색한다. 2. 애널리틱스 페이지에 들어왔다면 다음과 같은 화면이 나온다. 가입을 클릭 해주자. 3. 다음과 같이 순서에 맞춰 작성 후 추적 ID클릭하기를 눌러 다음으로 진행한다. (윈도우로 했더니 업종 카테고리와, 보고 시간대가 클릭이 안되어 크롬으로 다시 진행했다.) 4. 다음과 같은 화면이 뜨면 윗 부분에 나라를 대한민국으로 설정하고, 모두 동의 후 다음으로 진행~! 5. 조금 시간이 지체된 후 다음과 같은 화면이 뜨게 된다. 티스토리는 추적 ID만 복사하면 된다. 6. 티스토리 홈페이지 관리자에 들어와서 플러그인을 클릭하면 구글 애널리틱스를 찾을 수가 있다. 7. 아까 복사했던 추적코드를 붙여넣기 해주자.
이번에는 실제 데이터를 가지고 실습을 해보도록 하겠다. 1. Bostion dataset 로드 from sklearn import datasets sklearn 패키지에서 제공하는 open dataset을 가져오기 위해 사용하는 모듈 dataset이다. boston_house_prices = datasets.load_boston() datasets 모듈을 통해 보스턴 집 가격 데이터를 가져와 boston_house_prices 변수에 저장한다. print(boston_house_prices.keys()) 로드한 보스턴 전체 데이터에 key값을 출력한다. print(boston_house_prices.data.shape) 보스턴 전체 데이터 중 data에 대한 전체 행, 열 길이를 출력한다. print(b..
1. Python package 로드 및 matplotlib 출력 옵션 설정 우선 사용할 패키지들을 가져오자. 첫 번째 줄은 우리가 단일선형회귀분석을 하기 위해서 사용할 sklearn에 패키지 중 linear_model 모듈을 가져오는 코드이다. linear_model은 회귀분석을 할 수 있게 도와주는 모듈이다. 두 번째 줄은 numpy 패키지를 np라는 이름으로 가져온다. Numpy는 앞에서 배운 것 처럼 행렬, 벡터 등의 수학 계산을 위한 자료구조와 계산 함수를 제공하는 패키지이다. 세 번째 줄은 pandas 패키지를 pd라는 이름으로 가져오겠다. pandas 패키지는 CSV파일 또는 데이터베이스에서 데이터를 읽고 쓸 수 있고 또한 데이터를 쉽게 조작해 새로운 컬럼을 추가할 수 있는 패키지이다. 네 ..
1. 판다스를 이용하여 데이터 정리하기 구글에서 '서울시 관서별 5대 범죄 발생 검거 현황'이라는 검색어로 구글에서 검색한 결과를 보면 data.go.kr이라는 주소가 나타난다. 공공데이터 포럼에 가서 원하는 데이터를 다운 받을 수 잇다. 2015년 자료를 가지고 하겠다. 자료의 이름을 crime_in_Seoul로 바꾸고 파이썬 폴더에 저장하자. pandas를 이용해 데이터 정리하기 In: import numpy as np import pandas as pd 먼저 numpy와 pandas는 항상 import하는 모듈이라고 생각하면 된다. 이제 다운받은 데이터를 pandas로 읽어보겠다. crime_anal_police라는 변수를 저장한다. 그 내용을 보면 서울시 경찰서별로 살인, 강도, 강간, 절도 , ..
이제 첫 작업이다. 설레는 마음을 잠시 누르면서 먼저 목표에 대해 이야기 하겠다. 이번에는 서울시의 구별 CCTV 현황을 분석한다. 단순히 어디에 CCTV가 많이 설치 되었는지부터 시작해서 구별 인구 대비 비율을 확인하는 것까지 진행한다. 특히 인구 현황을 보면서 구별 인구 현황에 대해서도 확인해볼까 한다. 그리고 구별 CCTV 현황을 시각화하는 부분도 이야기하려고 한다. 1. CCTV 현황과 인구 현황 데이터 구하기 서울시의 CCTV 현황은 구글 검색만으로 쉽게 얻을 수 있다. '서울시 자치구 연도별 CCTV 설치 현황'을 검색하면 '서울 열린데이터 광장' 사이트의 해당 페이지로 갈 수 있다. 페이지 하단으로 가서 sheet 탭을 클릭하면 된다. 그러면 나타나는 화면에서 CSV를 클릭하면 다운 받을수 ..