Lecture

Multi-arm Bandits: Regret and Exploration

In course

Aliqua cillum enim commodo non cillum dolore aute exercitation veniam fugiat do Lorem pariatur eu. Commodo cupidatat enim officia sit ut. Enim sunt et do mollit adipisicing laboris nostrud culpa reprehenderit sint. Dolore elit occaecat eu laboris sunt ea adipisicing excepteur ex qui ullamco culpa. Ad occaecat ipsum commodo aliqua ex cupidatat laborum elit ut. Nostrud irure ea eu deserunt nostrud consequat nisi labore commodo officia officia qui.

Description

This lecture delves into the concept of regret in multi-arm bandit problems, exploring the trade-off between exploration and exploitation. The instructor explains how to calculate the expected regret over time steps, emphasizing the importance of the gap between optimal choices. The lecture covers the impact of time horizon on decision-making and introduces concentration bounds for tail probabilities. The discussion extends to Gaussian random variables, moment-generating functions, and the turn-off bound. The instructor highlights the challenges of balancing exploration and exploitation, showcasing the implications for real-world applications like internet advertising. The lecture concludes by hinting at future topics, including information-theoretic concepts and practical extensions of bandit algorithms.

Instructors (2)

ullamco sunt

Dolor enim adipisicing pariatur fugiat cupidatat non duis laboris nostrud laboris. Occaecat laboris minim laboris aliqua consectetur laboris anim reprehenderit. Fugiat reprehenderit pariatur adipisicing consectetur. Exercitation nulla officia anim velit sint cupidatat. Proident aliqua tempor aute amet quis elit aute ipsum laboris elit proident reprehenderit. Laboris quis sunt dolore sunt voluptate esse mollit pariatur. Nisi aute officia occaecat sint consequat sit dolor enim eu eiusmod est.

irure ex

Magna veniam reprehenderit laboris sit cupidatat cupidatat sit laborum eu occaecat deserunt. Do reprehenderit qui voluptate Lorem magna et elit duis quis aliqua commodo cillum officia ipsum. Voluptate ut laborum enim fugiat magna ex eiusmod. Proident elit qui deserunt sunt aliquip est dolore aliquip ipsum id aliqua est sit. Laboris aliqua ad non eiusmod ipsum cillum duis mollit.

Official source

https://mediaspace.epfl.ch/media/0_xdis2hbl

About this result

This page is automatically generated and may contain information that is not correct, complete, up-to-date, or relevant to your search query. The same applies to every other page on this website. Please make sure to verify the information with EPFL's official sources.

Ontological neighbourhood

Statistics

Statistical inference: Mathematical statistics

Related lectures (34)

Graph Chatbot

Chat with Graph Search

Ask any question about EPFL courses, lectures, exercises, research, news, etc. or try the example questions below.

DISCLAIMER: The Graph Chatbot is not programmed to provide explicit or categorical answers to your questions. Rather, it transforms your questions into API requests that are distributed across the various IT services officially administered by EPFL. Its purpose is solely to collect and recommend relevant references to content that you can explore to help you answer your questions.