티스토리 뷰
김승욱님 강의를 듣고 작성하였습니다.
데이터 확인
앞에서부터 데이터 5개 확인 | 뒤에서부터 데이터 5개 확인 |
> head(aws) AWS_ID TM TA Wind X. 1 108 2016-07-01 00 24.2 2.3 = 2 108 2016-07-01 01 24.3 2.3 = 3 108 2016-07-01 02 23.7 3.8 = 4 108 2016-07-01 03 23.3 3.0 = 5 108 2016-07-01 04 23.5 2.1 = 6 108 2016-07-01 05 23.5 2.7 = |
> tail(aws) AWS_ID TM TA Wind X. 5881 143 2016-10-31 09 8.7 0.8 = 5882 143 2016-10-31 10 9.6 0.4 = 5883 143 2016-10-31 11 10.0 0.6 = 5884 143 2016-10-31 12 10.5 0.8 = 5885 143 2016-10-31 13 11.4 1.4 = 5886 143 2016-10-31 14 11.3 0.9 = |
앞에서부터 데이터 10개 확인 | 뒤에서부터 데이터 10개 확인 |
> head(aws,10) AWS_ID TM TA Wind X. 1 108 2016-07-01 00 24.2 2.3 = 2 108 2016-07-01 01 24.3 2.3 = 3 108 2016-07-01 02 23.7 3.8 = 4 108 2016-07-01 03 23.3 3.0 = 5 108 2016-07-01 04 23.5 2.1 = 6 108 2016-07-01 05 23.5 2.7 = 7 108 2016-07-01 06 23.7 2.1 = 8 108 2016-07-01 07 24.0 0.3 = 9 108 2016-07-01 08 24.4 2.1 = 10 108 2016-07-01 09 25.0 2.2 = |
> tail(aws,10) AWS_ID TM TA Wind X. 5877 143 2016-10-31 05 6.9 0.9 = 5878 143 2016-10-31 06 7.2 0.8 = 5879 143 2016-10-31 07 7.3 0.8 = 5880 143 2016-10-31 08 7.5 1.1 = 5881 143 2016-10-31 09 8.7 0.8 = 5882 143 2016-10-31 10 9.6 0.4 = 5883 143 2016-10-31 11 10.0 0.6 = 5884 143 2016-10-31 12 10.5 0.8 = 5885 143 2016-10-31 13 11.4 1.4 = 5886 143 2016-10-31 14 11.3 0.9 = |
변수를 넣어 head(x = aws, n=5) 이런식으로 해도 같은 결과가 나온다.
aws_id는 기상청 기계 id, tm은 시간, ta는 기온, wind는 풍속, x는 무의미
객체 구조 및 변수별 기술통계 확인
전체적인 구조를 보고 싶을 때, str(structure, 객체명) - 객체 구조 확인 |
> str(aws) 'data.frame': 5886 obs. of 5 variables: $ AWS_ID: int 108 108 108 108 108 108 108 108 108 108 ... $ TM : chr "2016-07-01 00" "2016-07-01 01" "2016-07-01 02" "2016-07-01 03" ... $ TA : num 24.2 24.3 23.7 23.3 23.5 23.5 23.7 24 24.4 25 ... $ Wind : num 2.3 2.3 3.8 3 2.1 2.7 2.1 0.3 2.1 2.2 ... $ X. : chr "=" "=" "=" "=" ... |
int 정수 chr 문자 num 숫자
요약 정보를 나타낼때, summary(객체명) - 각 변수의 기술통계 확인 |
> summary(aws) AWS_ID TM Min. :108.0 Length:5886 1st Qu.:108.0 Class :character Median :125.5 Mode :character Mean :125.5 3rd Qu.:143.0 Max. :143.0 TA Wind Min. : 1.7 Min. :0.000 1st Qu.:19.5 1st Qu.:1.100 Median :23.6 Median :1.800 Mean :23.3 Mean :1.993 3rd Qu.:27.5 3rd Qu.:2.700 Max. :37.5 Max. :7.800 X. Length:5886 Class :character Mode :character |
객체 구조 및 변수별 기술통계 확인
nrow(객체명) - 행 개수 확인 | ncol(객체명) - 열 개수 확인 |
> nrow(aws) [1] 5886 |
> ncol(aws) [1] 5 |
dim(객체명) - 행/열 개수 확인 | colnames(객체명) - 변수명 확인 |
> dim(aws) [1] 5886 5 |
> colnames(aws) [1] "AWS_ID" "TM" "TA" "Wind" [5] "X." |
이 외에도 rownames(), names() 함수도 있다.
환경창에서 확인할 수 있다고 생각하겠지만, 위 함수들은 반복문, 조건문, 데이터를 계속 추가해야 하는 경우 유용하게 쓰인다.