Playing OpenAI GYM Games

티스토리 뷰

beginner/파이썬 강화학습 기초

Playing OpenAI GYM Games

johh 2019. 5. 25. 16:54

다음과 같은 게임이 있다. S에서 출발하여 G에 도착하는 게임인데 F는 지나갈 수 있고 H에 가게되면 빠져 죽는 게임이라고 한다. 이 게임에 대해서 알고리즘을

Agent가 environment에서 action을 취하며 돌아다닐 것이다. 이 action에 따라서 enviroment는 상태를 돌려준다. 여기서는 index를 state로서 되돌려 줄 것이다. 그리고 reward는 G에 도착하게 되었을때 점수를 줄 것이다.

예를 들어보자.

만약 S에서 오른쪽으로 한 칸 움직였다면, state:1, reward:0이 된다.

이것을 일반화 하면 Frozen Lack 뿐만 아니라 거의 모든 환경에 적용할 수 있다.

OpenAI Gym에 가면 많은 정보를 얻을 수 있다. gym.openai.com/

OpenAI를 사용하는 방법은 매우 간단하다.

import gym # gym 설치

env = gym.make("Taxi-v1") # Tax-v1이라는 환경을 생성시킨다.

observation = env.reset( ) # 환경을 초기화

for _ in range(1000):

env.render( ) # 환경을 화면으로 출력

action = env.action_space.sample( ) # 환경에 따라 적절한 액션을 선정(random actions)

observation, reward, done, info = evb.step(action) # 액션이 환경에서 일어나고 결과값 observation이 나오고 보상이 있다면 reward 값도 나온다. done은 Frozen Lake같은 경우 H에 빠져 끝이 났는지 T/F. info는 추가정보.

Frozen Lake의 경우 다음과 같이 만들 수 있다.

위 문제를 보면 시시하다고 생각할 수 있겠지만 실제로 Agent 입장에서는 Environment가 보이지 않는다. 실제로는 직접 움직여 보아야 이게 얼음판인지 홀인지 판단할 수 있다. 이렇기 때문에 이 문제가 쉽지 않다.

시작점이 S인데 오른쪽으로 가면 이게 홀인지 얼음인지 골인지 모르는 상태에서 최종 골을 찾아내야 한다.

출처 : https://youtu.be/xgoO54qN4lY

'beginner > 파이썬 강화학습 기초' 카테고리의 다른 글

Introduction (0)	2019.05.25

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

글 보관함

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

조환희의 학습 블로그

티스토리 뷰

Playing OpenAI GYM Games

'beginner > 파이썬 강화학습 기초' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역