티스토리 뷰

Reinforcement가 어떤 의미를 가지고 있는지, Reinforceabling이 뭐하는 것인지, 어떤 문제를 풀 수 있는지 개략적으로 알아보겠다. 

 

reinforcement는 굉장히 폭넓은 분야에서 사용되고 있는데 그 중 하나가 어떤 것을 훈련시킬때 사용된다.

 

우리의 삶에서 어떤 것을 배울 때 하는 행동들이 Reinforcement와 유사하다.

 

환경속에서 상태 변경되면 내가 어떤 행동을 할 때 마다 상태가 업데이트 된다. 치즈를 찾는게 목표인데 돌아다니며 매 순간마다 잘했다 못했다라는 것은 주어지지 않지만 마지막에 운이 좋아서 치즈를 발견하게 된다면 보상으로 받게 된다. 이런 형태의 환경으로 구성할 수 있는 것이 Reinforcement Learning이다.

Reinforcement는 최근들어 나와있는 알고리즘이 아니고 굉장히 오래전부터 소개되었던 알고리즘 이다.(1997년 Tom Mitchell, Machine Learning). 실제로 머신러닝 수업에서 많이 다루진 않았다. 

 

단순히 어떤 상황에서 오른쪽으로 움직일까하는 reinforcement learning의 알고리즘으로 여러 게임에 적용해 보았다. 그 단순한 알고리즘으로도 몇 개의 게임에서는 사람보다도 우수한 능력을 보였다. (특화된 게임 아님)

 

다양한 분야에서 사용되는 강화학습

 

강화학습 공부 전체적인 스케쥴

 

출처 : https://youtu.be/dZ4vw6v3LcA

'beginner > 파이썬 강화학습 기초' 카테고리의 다른 글

Playing OpenAI GYM Games  (0) 2019.05.25
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함