Markov Decision Process 的程式範例

前言之前跟大家介紹過 Markov Decision Process(MDP) 的原理跟數學推導 還有 在 Human-Robot Interaction 上的應用,今天我們就帶大家透過一個程式來體驗實作上的細節。有興趣的讀者可以透過這個例子將這個程式應用到機器人上! 快速複習 MDP 的基本概念在進入問題之前,我們先簡單複習一下 MDP,首先是 MDP 的定義: 然後,假設已經知道在每個 state 會獲得多少 reward,我們就

Read More...

如何用 Markov Decision Process 描述 Human-Robot Interaction 問題

前言上次我們介紹了 Markov Decision Process 的基本概念,雖然上次有簡單提到 MDP 的應用,但並不是很詳細,所以今天我們想嘗試把 MDP 跟 Human-Robot Interaction 問題連結起來,一起來看怎麼從一個簡單的 insight 出發,加上 MDP 的數學基礎,最後形成一篇嚴謹的論文 ( Human-Robot Interactive Planning using Cross-Training:

Read More...