DRL1 [도서 리뷰] 그로킹 심층 강화학습 그로킹 심층 강화학습 미겔 모랄레스 지음 강찬석 옮김 목차 CHAPTER 1 심층 강화학습의 기초 1.1 심층 강화학습이란 무엇인가? 1.2 심층 강화학습의 과거와 현재 그리고 미래 1.3 심층 강화학습의 적절성 1.4 두 가지의 명확한 기대치 설정 1.5 요약 CHAPTER 2 강화학습의 수학적 기초 2.1 강화학습의 구성 요소 2.2 MDP: 환경의 엔진 2.3 요약 CHAPTER 3 순간 목표와 장기 목표 간의 균형 3.1 의사결정을 내리는 에이전트의 목적 3.2 이상적인 행동들에 대한 계획 3.3 요약 CHAPTER 4 정보의 수집과 사용 간의 균형 4.1 평가가능한 피드백 해석의 어려움 4.2 전략적인 탐색 4.3 요약 CHAPTER 5 에이전트의 행동 평가 5.1 정책들의 가치를 추정하는 학습.. 2022. 8. 28. 이전 1 다음 반응형