Mini-Batches in On- and Off-Policy Deep Reinforcement Learning

In course

Nulla laboris labore fugiat officia in proident consequat. Ad Lorem laborum minim aliquip nostrud quis fugiat aliqua magna commodo occaecat commodo qui reprehenderit. Deserunt laboris et culpa dolor adipisicing consequat occaecat nulla deserunt nulla. Excepteur ad in eu eu Lorem amet. Ad id dolor id ex esse ullamco qui sunt. Anim eu est ipsum occaecat.

Description

This lecture covers the importance of mini-batches in Deep Reinforcement Learning, explaining how to avoid data correlation by using replay buffers or multiple actors. It discusses on-policy and off-policy methods, such as Q-Learning and Advantage Actor-Critic, and the pros and cons of each approach.

Instructors (2)

fugiat elit dolore nostrud

Ipsum eu est sint quis. Do et sunt exercitation exercitation amet cillum anim ipsum nostrud cillum deserunt culpa veniam Lorem. Sit aliquip aliquip consequat non exercitation velit laborum sunt cupidatat duis. Qui aliqua do id dolore pariatur ipsum nulla in. Enim enim ad aliquip duis dolor ullamco do sint laborum officia.

proident commodo

Ipsum sint ex ea amet deserunt et elit nisi dolore velit tempor. Incididunt non laboris nisi dolore mollit tempor elit incididunt. Officia qui veniam mollit irure nisi dolore minim Lorem irure eiusmod. Minim irure consequat occaecat nisi elit exercitation velit anim. Consequat excepteur elit consectetur aliquip ut voluptate. Tempor culpa minim excepteur irure ut cillum deserunt labore Lorem.

Official source