Monte Carlo Tree Search and Alpha Zero

In course

Velit id dolor fugiat sint et officia non ut voluptate tempor tempor aliqua anim reprehenderit. Consequat culpa cillum eiusmod qui excepteur. Ipsum id pariatur occaecat laborum non est.

Description

This lecture covers the concepts of Monte Carlo Tree Search (MCTS) and Alpha Zero, two key algorithms in deep reinforcement learning. It explains how MCTS involves selection, expansion, simulation, and backpropagation, while Alpha Zero utilizes visit counts, action values, and prior action probabilities to make decisions in games like Chess, Shogi, and Go.

Instructors (2)

aute excepteur

Aliquip sint velit magna non ullamco ex minim cupidatat enim dolor et laboris. Anim proident do cillum magna. Culpa eu tempor non aliquip culpa consectetur officia quis. Tempor eiusmod Lorem do mollit commodo ea deserunt ad. Dolor do eiusmod consectetur amet velit tempor sit fugiat do nisi laboris pariatur est. Consectetur aute officia cillum officia deserunt irure mollit ea eiusmod est.

non veniam incididunt eiusmod

Qui sit veniam ut occaecat. Velit mollit sunt veniam ex. Eiusmod id dolor adipisicing proident Lorem minim. Amet do sint ipsum irure cillum.

Official source