티스토리 뷰
In [1]:
import pandas as pd
import numpy as np
In [2]:
df=pd.read_csv('finally_beer.csv',encoding='utf-8-sig', names=['user', 'beer_name', 'brewery','beer_style','score','date'])
df.head()
Out[2]:
In [3]:
df.info()
In [4]:
df.isnull().sum()
Out[4]:
In [5]:
len(df['beer_name'].unique())
Out[5]:
In [6]:
len(df['user'].unique()), df['user'].unique()
Out[6]:
In [7]:
len(df['beer_style'].unique()),df['beer_style'].unique()
Out[7]:
In [8]:
df['user'].drop_duplicates()
Out[8]:
In [9]:
df['user']=df['user'].astype(int)
df.info()
In [10]:
df['score'].drop_duplicates()
Out[10]:
In [11]:
df['월']=df['date'].apply(lambda e: e.strip().split('/')[0])
df['일']=df['date'].apply(lambda e: e.strip().split('/')[1])
df['년']=df['date'].apply(lambda e: e.strip().split('/')[2])
df.head()
Out[11]:
In [15]:
df['월']=df['월'].astype(int)
df['일']=df['일'].astype(int)
df['년']=df['년'].astype(int)
df.info()
In [29]:
df['date']=pd.to_datetime(df['date'])
df.head()
Out[29]:
In [35]:
df2=df.sort_values(by=['user','date'],axis=0)
df2.head(10)
Out[35]:
In [38]:
df2.to_csv('finally_beer_1.csv',index=False)
'beginner > 파이썬 분석' 카테고리의 다른 글
서울시 구별 CCTV 현황 분석-1 (1) | 2019.06.27 |
---|---|
맥주 추천시스템-데이터분할 (0) | 2019.04.23 |
캐글 타이타닉 데이터 분석 - 2 (1) | 2019.04.12 |
캐글 타이타닉 데이터 분석 - 1 (0) | 2019.04.11 |
Pandas를 이용한 지하철 데이터 분석 (0) | 2019.03.12 |