초짜공대생의공부노트

  • 홈
  • 태그
  • 방명록

Machine Learning/Reinforcement Learning 1

RL에 들어가기 앞서

강화학습을 공부하게 된 계기는 선배와의 협업을 통해 본의 아니게 시작하게 되었다기본적인 머신러닝이나 신경망에 대해서도 제대로 알지 못한 채 강화학습의 세계에 뛰어들어 허우적거리다 보니, 이제는 정리가 필요하다고 느낀다. 차량이나 선박과 같이 Markov Decision Process(MDP)로 구성 가능한 경우, 강화학습을 사용하는 것이 적합하다는 사실은 알고 있다. 하지만 논문을 읽다 보면, 최적화를 위해서 혹은 방법론의 하나로 강화학습이 자주 사용되는 것을 볼 수 있다. 흥미로운 점은, 많은 논문들이 MDP로 표현하기 어려운 상황에서도 강화학습을 사용한다는 것이다. 그것이 반드시 최적화 문제를 풀기 위한 해법이 아님에도 불구하고, 방법론으로 제시되고 또 accept이 많이 되고 있으니, 괜히 RL을 ..

Machine Learning/Reinforcement Learning 2025.08.05
이전
1
다음
더보기
프로필사진

  • 분류 전체보기 (9)
    • PRML (7)
      • Chapter 8. Graphical Models (4)
      • Chapter 1. Introduction (1)
      • Chapter 13. Sequential Data (2)
    • Unity (0)
    • Unreal Engine (0)
    • Random Probability (0)
    • Mobile Communication (0)
    • Convex Optimization (1)
    • Machine Learning (1)
      • Reinforcement Learning (1)

Tag

베이즈 필터, Potential Function, Markov, Sum product Algorithm, Bipartite Graph, Belief Propagation, 공대생, 확률, kalman filter, Bayesian Network, 그래프, 노이즈, Factor Graph, PRML, 칼만 필터, 컨벡스 최적화, Chain Graph, Max Sum Algorithm, junction tree, 관측,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/08   »
일 월 화 수 목 금 토
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바