search 2

[머신러닝 - 이론] MCTS (Monte Carlo Tree Search) (몬테카를로 트리 탐색)

1. 몬테카를로 방법이란? 몬테카를로 방법은 난수를 생성하여 시뮬레이션하는 방법입니다. 이러한 방법을 이용해서 트리를 탐색하는 MCTS(Monte Carlo Tree Search)알고리즘이 개발되었습니다. 몬테카를로 방법에서는 자신의 상태에서 다음 상태를 랜덤으로 정합니다. 즉 자식 노드 중에 랜덤 하게 선택을 하고, 선택된 노드에서 플레이아웃을 생성해서 시뮬레이션을 합니다. 이때 승패가 정해질 때까지 랜덤하게 수를 선택해 나갑니다. 이후 승패가 결정되면 점수를 부여하고, 각 노드에서 승리 횟수/방문 회수를 갱신합니다. 마지막으로 승률이 가장 높은 수를 최종적으로 선택합니다. 즉, 자식 노드 중에 랜덤하게 선택 선택된 노드에서 시뮬레이션, 승패가 정해질 때까지 랜덤 하게 선택 승패가 정해지면 점수를 부여..

[머신러닝 - 이론] Search (탐색)

인공지능에서의 공간 탐색 능력은 대표적인 예시로 알파고가 있습니다. 현재 게임 상태에서 최적의 다음 상태를 탐색하는 것입니다. 즉 탐색이란 특정 상황에서 최적의 해를 찾기 위해 공간을 탐색하는 것이고, 공간은 문제의 solution이 될 수 있는 집합을 공간으로 가정하는 것입니다. 알고리즘의 BackTracking, Branch and Bound와 흡사하다고 보면 될 것 같습니다. 최적의 해를 찾기 위해 solution 혹은 경우의 수들을 공간으로 가정하고, 그 공간을 탐색하는 것이 탐색, search입니다. 예를 들면 어떻게 골을 넣을 수 있을까, 다음 수를 어떻게 둬야 게임에서 이길 수 있을까와 같이 특정한 목표를 가지고 탐색하는 것이라고 보면 되겠습니다. 이때 상태 공간(State Space)에 대..