티스토리 뷰

김승욱님 강의를 듣고 작성하였습니다.

 

[R을 R려줘] R 문법 기초 - 인프런

데이터 분석을 시작하기 위해서 선택하는 필수 언어 중 하나인 R을 배우는 과정 입니다. 프로그래밍 언어를 처음 배우는 사람도 충분히 따라할 수 있을 정도로 쉽게 제작되어 있으니 부담없이 따라할 수 있습니다. 입문 프로그래밍 언어 R 온라인 강의

www.inflearn.com

데이터 확인

앞에서부터 데이터  5개 확인 뒤에서부터 데이터 5개 확인
> head(aws) 
   AWS_ID            TM   TA Wind X. 
1    108 2016-07-01 00 24.2  2.3  =
2    108 2016-07-01 01 24.3  2.3  =
3    108 2016-07-01 02 23.7  3.8  =
4    108 2016-07-01 03 23.3  3.0  =
5    108 2016-07-01 04 23.5  2.1  =
6    108 2016-07-01 05 23.5  2.7  =
> tail(aws)
     AWS_ID            TM   TA Wind X.
5881    143 2016-10-31 09  8.7  0.8  =
5882    143 2016-10-31 10  9.6  0.4  =
5883    143 2016-10-31 11 10.0  0.6  =
5884    143 2016-10-31 12 10.5  0.8  =
5885    143 2016-10-31 13 11.4  1.4  =
5886    143 2016-10-31 14 11.3  0.9  =
앞에서부터 데이터  10개 확인 뒤에서부터 데이터 10개 확인
> head(aws,10)
   AWS_ID            TM   TA Wind X.
1     108 2016-07-01 00 24.2  2.3  =
2     108 2016-07-01 01 24.3  2.3  =
3     108 2016-07-01 02 23.7  3.8  =
4     108 2016-07-01 03 23.3  3.0  =
5     108 2016-07-01 04 23.5  2.1  =
6     108 2016-07-01 05 23.5  2.7  =
7     108 2016-07-01 06 23.7  2.1  =
8     108 2016-07-01 07 24.0  0.3  =
9     108 2016-07-01 08 24.4  2.1  =
10    108 2016-07-01 09 25.0  2.2  =
> tail(aws,10)
     AWS_ID            TM   TA Wind X.
5877    143 2016-10-31 05  6.9  0.9  =
5878    143 2016-10-31 06  7.2  0.8  =
5879    143 2016-10-31 07  7.3  0.8  =
5880    143 2016-10-31 08  7.5  1.1  =
5881    143 2016-10-31 09  8.7  0.8  =
5882    143 2016-10-31 10  9.6  0.4  =
5883    143 2016-10-31 11 10.0  0.6  =
5884    143 2016-10-31 12 10.5  0.8  =
5885    143 2016-10-31 13 11.4  1.4  =
5886    143 2016-10-31 14 11.3  0.9  =

변수를 넣어 head(x = aws, n=5) 이런식으로 해도 같은 결과가 나온다.

aws_id는 기상청 기계 id, tm은 시간, ta는 기온, wind는 풍속, x는 무의미

객체 구조 및 변수별 기술통계 확인

전체적인 구조를 보고 싶을 때, str(structure, 객체명) - 객체 구조 확인
> str(aws)
'data.frame': 5886 obs. of  5 variables:
 $ AWS_ID: int  108 108 108 108 108 108 108 108 108 108 ...
 $ TM    : chr  "2016-07-01 00" "2016-07-01 01" "2016-07-01 02" "2016-07-01 03" ...
 $ TA    : num  24.2 24.3 23.7 23.3 23.5 23.5 23.7 24 24.4 25 ...
 $ Wind  : num  2.3 2.3 3.8 3 2.1 2.7 2.1 0.3 2.1 2.2 ...
 $ X.    : chr  "=" "=" "=" "=" ...

int 정수 chr 문자 num 숫자

요약 정보를 나타낼때, summary(객체명) - 각 변수의 기술통계 확인
> summary(aws)
     AWS_ID           TM           
 Min.   :108.0   Length:5886       
 1st Qu.:108.0   Class :character  
 Median :125.5   Mode  :character  
 Mean   :125.5                     
 3rd Qu.:143.0                     
 Max.   :143.0                     
       TA            Wind      
 Min.   : 1.7   Min.   :0.000  
 1st Qu.:19.5   1st Qu.:1.100  
 Median :23.6   Median :1.800  
 Mean   :23.3   Mean   :1.993  
 3rd Qu.:27.5   3rd Qu.:2.700  
 Max.   :37.5   Max.   :7.800  
      X.           
 Length:5886       
 Class :character  
 Mode  :character  

 

객체 구조 및 변수별 기술통계 확인

nrow(객체명) - 행 개수 확인 ncol(객체명) - 열 개수 확인
> nrow(aws)
[1] 5886
> ncol(aws)
[1] 5
dim(객체명) - 행/열 개수 확인 colnames(객체명) - 변수명 확인
> dim(aws)
[1] 5886    5
> colnames(aws)
[1] "AWS_ID" "TM"     "TA"     "Wind"  
[5] "X."  

이 외에도 rownames(), names() 함수도 있다.

환경창에서 확인할 수 있다고 생각하겠지만, 위 함수들은 반복문, 조건문, 데이터를 계속 추가해야 하는 경우 유용하게 쓰인다.

####을 오른쪽에 치면 밑에있는 탭에 추가되어서 그 위치로 바로 하이라이트 이동 가능

'beginner > R 문법 기초' 카테고리의 다른 글

R 데이터 치환 및 삽입  (0) 2019.07.16
R 데이터 추출  (0) 2019.07.12
R 데이터 입력  (0) 2019.07.10
R 기본 문법  (0) 2019.07.05
기본 자료형  (0) 2019.07.02
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함