Markov Decision Process 的程式範例

前言之前跟大家介紹過 Markov Decision Process(MDP) 的原理跟數學推導 還有 在 Human-Robot Interaction 上的應用,今天我們就帶大家透過一個程式來體驗實作上的細節。有興趣的讀者可以透過這個例子將這個程式應用到機器人上! 快速複習 MDP 的基本概念在進入問題之前,我們先簡單複習一下 MDP,首先是 MDP 的定義: 然後,假設已經知道在每個 state 會獲得多少 reward,我們就

Read More...

如何用 Markov Decision Process 描述 Human-Robot Interaction 問題

前言上次我們介紹了 Markov Decision Process 的基本概念,雖然上次有簡單提到 MDP 的應用,但並不是很詳細,所以今天我們想嘗試把 MDP 跟 Human-Robot Interaction 問題連結起來,一起來看怎麼從一個簡單的 insight 出發,加上 MDP 的數學基礎,最後形成一篇嚴謹的論文 ( Human-Robot Interactive Planning using Cross-Training:

Read More...

簡介 Markov Decision Process 與其應用

前言今天想跟大家介紹一個在 Reinforcement Learning 中相當重要的基礎 - Markov Decision Process(MDP)。比起一般的 search,MDP 能夠 model 更複雜的問題,今天就讓我們來介紹 MDP 的基礎觀念,還有他的應用跟限制。 MDP 想要 model 什麼問題?MDP 想要處理的問題是:當你採取的 action 不會完全如你所想的達到你想要的 state,你該如何採取 action

Read More...