안녕

  • 홈
  • 태그
  • 방명록

MDP 1

[머신러닝 - 이론] 강화 학습의 기초 (Fundamental of Reinforcement Learning)

강화 학습을 잘 모를 수 있지만, 알파고를 모를 수는 없습니다. 알파고는 강화 학습을 통해 학습된 모델입니다. 이처럼 강화학습은 요즘 가장 흥미진진한 분야이자 가장 오래된 분야 중 하나입니다. 사람은 주위를 센싱하고 인식하여 적절한 행위를 통해 환경과 상호작용합니다. 인공지능 제품도 비슷한 과정을 수행해야 쓸모가 있습니다. 1. 에이전트 (Agent) 일상생활에서 에이전트 (Agent)란 특정한 일을 대행해주는 사람을 뜻합니다. 강화 학습에서의 에이전트는 관측을 하고 주어진 환경에서 행동을 합니다. 그리고 그 결과로 보상을 받습니다. 에이전트의 목적은 보상의 장기간 기대치를 최대로 만드는 행동을 학습하는 것입니다. 목적지에 도착하면 양의 보상을 받고, 시간을 낭비하거나 잘못된 방향으로 향하면 음의 보상을..

인공지능/머신러닝 2022.04.18
1
프로필사진

  • 분류 전체보기 (462)
    • 인공지능 (74)
      • 머신러닝 (58)
      • Computer Vision (8)
      • Anaconda (6)
      • Pytorch (2)
    • 논문 (9)
      • Image&Video Recognition (4)
      • Image&Video Super-Resolutio.. (5)
      • QAT(Quantization Aware Trai.. (0)
      • PTQ(Post Training Quantizat.. (0)
    • Computer Science (281)
      • 컴퓨터 구조 (34)
      • 알고리즘 (179)
      • 네트워크 (43)
      • 비디오 코덱 (1)
      • 데이터 베이스 (24)
    • Python Library (55)
      • OpenCV (2)
      • Numpy (0)
      • Pandas (31)
      • Matplotlib (5)
      • 웹 크롤링 (9)
      • 오픈 소스 프로그래밍 (8)
    • 프로그래밍 언어 (10)
      • Python (9)
      • Matlab (1)
    • 수학 (16)
      • 확률과 통계 (16)
    • 여러 공부 (0)
    • 학교 수업 (7)
      • 회계와 사회 생활 (6)
    • 나의 일상 (10)

페이스북 트위터 플러그인

  • GitHub
  • Instagram

공지사항

  • 이것저것

방문자수Total

  • Today :
  • Yesterday :
05-30 00:04

Copyright © Kakao Corp. All rights reserved.

  • GitHub

티스토리툴바

개인정보

  • 티스토리 홈
  • 포럼
  • 로그인

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.