TechBridge 技術共筆部落格

var topics = ['Web前後端', '行動網路', '機器人/物聯網', '數據分析', '產品設計', 'etc.']

2018-10-27 | Markov Decision Process, Reinforcement Learning

簡介 Markov Decision Process 與其應用

前言今天想跟大家介紹一個在 Reinforcement Learning 中相當重要的基礎 - Markov Decision Process（MDP）。比起一般的 search，MDP 能夠 model 更複雜的問題，今天就讓我們來介紹 MDP 的基礎觀念，還有他的應用跟限制。 MDP 想要 model 什麼問題？MDP 想要處理的問題是：當你採取的 action 不會完全如你所想的達到你想要的 state，你該如何採取 action

2017-11-04 | Reinforcement Learning, OpenAI Gym, Q Learning

Open AI Gym 簡介與 Q learning 演算法實作

前言這次我們來跟大家介紹一下 OpenAI Gym，並用裡面的一個環境來實作一個 Q learning 演算法，體會一次 reinforcement learning (以下簡稱 RL) 的概念。 OpenAI Gym 是一個提供許多測試環境的工具，讓大家有一個共同的環境可以測試自己的 RL 演算法，而不用花時間去搭建自己的測試環境。把 Gym 跑起來的最簡單範例一開始學習，範例總是越簡單越好，這樣才會有開始上手的成就感。 12345