深度強化式學習(Deep Reinforcement Learning)在許多領域皆取得了顯著的成果,如遊戲、機器人控制以及自然語言處理等。在這些領域中,遊戲被視為最適合測試深度強化式學習演算法領域之一,因為相對於真實世界複雜的模型,遊戲的環境相對容易取得並且能重複使用。例如,在2016年,AlphaGo結合深度強化式學習與搜尋算法,並擊敗了圍棋世界冠軍李世石。在AlphaGo取得成功之後,後續有許多深度強化式學習演算法如AlphaZero、MuZero在其他電腦遊戲中也展現了超越人類表現的水準,而這些演算法在訓練過程中甚至沒有使用到任何的人類知識。本次演講將從介紹強化學習的基本概念開始。然後,我們會討論一些用於遊戲和其他領域的強化學習算法。
活動訊息
10/21 10:40 - 11:05
資訊科學研究所
資訊所新館106演講廳
活動分類
數理科學
演講座談
主辦單位
適合對象
參加須知
70 人
陳冠文
02-27883799分機2203