제논 블로그

  • 홈
  • AI to the Real World
  • AI Study
  • AI Connect
  • MNC Column
  • MNC Inside

GreedyAction 1

[RL] 2-2. Exploration과 Exploitation: Greedy Method vs. Epsilon-greedy Method

앞의 포스팅에서는 강화학습의 개념을 이해하고, 강화학습을 구성하는 필수 요소들에 대해 알아봤습니다. 이번 포스팅에서는 강화학습 분야에서 오랜 기간동안 연구되어 온 Multi-armed Bandit 문제를 기반으로 Exploration과 Exploitation에 대해 살펴보려고 합니다. Multi-armed Bandit 문제에 대해 설명하고 이 문제를 구현하여 Exploration과 Exploitation 에 대해 설명드리겠습니다. 본 포스팅에서 다루는 설명은 Sutton의 강화학습 책을 많이 참고하였습니다. 관련 코드는 Github 에서 확인할 수 있습니다. Greedy Method Exploitation을 하기 위해서 우리는 행동에 대한 평가가 필요합니다. 이 평가는 이전 포스팅에서 배운 Value라는..

AI Study/강화학습 2022.09.14
1
더보기
프로필사진

제논(구 마인즈앤컴퍼니)의 블로그입니다.

  • 분류 전체보기 (70)
    • Generative AI ON (14)
      • 모델 개발기 (0)
      • 캐글 탐험대 (6)
      • 민팃 (4)
    • Genon Column (2)
      • Leadership Insight (1)
    • AI Study (15)
      • ML101 (10)
      • 생성모델 (1)
      • 강화학습 (4)
    • Genon Inside (27)
      • 단짠단짠 제논 라이프 (4)
      • AI CONNECT (12)
      • 커넥트로그 (5)
    • AI 솔루션 (8)
      • Semantic Search (3)
      • MLOps (2)
      • LLMOps (3)
    • Genon News (1)
    • NEXT AI (3)

Tag

datascientist, ChatGPT, AI커넥트, DataScience, 인공지능대회, mnc, 마인즈앤컴퍼니, 민팃, AI, 인공지능, 생성AI, 캐글, AI경진대회, 인공지능경진대회, 딥러닝, LLM, ai대회, 머신러닝, Kaggle, aiconnect,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

Copyright © MINDS AND COMPANY. All rights reserved.

티스토리툴바