Shingling, MinHashing and Common distance measure I

誰適合閱讀這篇文章:熟悉 Hash, Set, Tries (Prefix and Suffix Tree) 等資料結構和有志從事大量資料分析的電腦工程師 主要解決問題:給定一份文件,如何在網際網路的無盡文件大海中,找到相似的文件?主要應用:偵測剽竊 (Plagiarism),搜尋引擎欲尋找鏡像網頁,網路購物或電影推薦系統中的協同過濾 綱要: 如何快速比較兩文件集合並提供量化結果: a. 如何定義相似度? b. 如何重新定義相似度

Read More...

一起讀 Knowledge-Enabled Robotic Agents for Shelf Replenishment in Cluttered Retail Environments

前言今天來跟大家一起看一篇論文,可以讓機器人將貨架整理成指定的樣子,算是比較進階的機器人應用。大家可以先看個影片,對整個應用會比較有概念。 系統 overview有 overview,就比較能夠繼續往下看。所以首先讓我們來看看整個系統架構: 整個系統的運作流程如下: CRAM 先產生最初的任務 - 重新整理貨架,整理成跟 KNOWROB 中儲存的樣貌一樣 CRAM 向 ROBOSHERLOCK 提出 query ,以偵測有哪些物品

Read More...

用 Python 自學資料科學與機器學習入門實戰:Matplotlib 基礎入門

前言本系列文章將透過系統介紹資料科學(Data Science)相關的知識,透過 Python 帶領讀者從零開始進入資料科學的世界。這邊我們將介紹 Matplotlib 這個 Python 資料視覺化的核心工具。 什麼是 Matplotlib?Python 的視覺化套件有靜態的 Matplotlib、Seaborn 和 ggplot(借鏡於 R 的 ggplot2)套件以及動態的 Bokeh 套件(類似於 D3.js)。其中 Matp

Read More...

來寫個氣象機器人吧!(Part 1)

Let’s build a weather bot!簡介沒有人會懷疑了解天氣的重要性,我們總是看氣象預報或查天氣來決定等下外出時要不要帶傘,衣服要穿多厚是否需要帶件外套,或是需不需要先擦防曬油戴一副墨鏡出門等等。 想查天氣的時候我想大部分人可能就是 Google 一下、上中央氣象局網站、使用 APP、看新聞。或是有種很潮的做法是問 Siri,不過效果可能不太好 ⋯⋯。 其實還有一種做法是建立一個天氣機器人,其實概念就是聊天機器人,讓我

Read More...

[筆記] JavaScript: Understanding the Weird Parts --- Build your own lib/framework

之前趁著 Udemy 特價,買了上面很有名的課程 - JavaScript: Understanding the Weird Parts,當初會想買是因為他最後面有個章節是介紹如何建構自己的 JS Framework,而我一直都很想有系統性地去瞭解建構一個可供大家使用的 JS library 或是 framework 需要注意哪些事項,該怎麼寫才是安全有彈性的結構。 後來大約花了三天的時間斷斷續續把課程上完,這邊紀錄一下該章節的一些筆記

Read More...

打造後台管理系統的好幫手:Ant Design

前言很多公司都會需要一個僅供內部使用的後台系統,來管理公司內的一些事情。不過也因為是公司內的產品,投入的資源比起給外面使用者的產品往往都來得較少,身為一個前端工程師,你很有可能必須身兼設計,決定整個 UI 的長相。 這時候呢,如果能找到一套現成的 Library 當然就最棒了! 這篇主要會介紹由螞蟻金服開源出來的 Ant Design 這套 UI 的 Library,並且讓大家看看幾個範例。 後台系統的 UI在我認識 Ant Desig

Read More...

清晰說明針孔相機的內部參數與外部參數矩陣

前言學習電腦視覺的同學們應該都有學習過相機的內部參數和外部參數矩陣,網路上也有很多說明文章,不過在學習過程中,還是花了一些時間把一些似懂非懂的觀念釐清,所以今天想要來寫一篇文章幫大家整理最簡單的基本概念,讓學習變得更容易。 內部參數和外部參數矩陣最基本的應用就是從 2D 影像去重建 3D 世界的樣貌,也就是可以從畫面中的點去推得 3D 世界中的座標,接下來就讓我們一起來看看基本的原理。 成像的原理最基本的相機模型,就是針孔相機。他的成像

Read More...

如何在 Windows 打造 Python 開發環境設定基礎入門教學

前言如何設定開發環境應該是每個初學程式設計者的痛(即便是老手有時也會覺得苦惱),尤其當你需要在終端機(terminal)輸入指令(command)來操控你的指令時(好吧,若你完全只走圖形化介面,習慣 GUI 操作就另當別論,但若你有志於往程式設計領域發展,建議還是熟悉一下指令碼)。 要在 Linux、Mac OS 這種屬於類 Unix 系統(指各種 Unix 的衍生系統,而 Unix 指的是一種電腦作業系統,具有多工、多使用者的特色,是

Read More...

用 Javascript 進行邏輯迴歸分析

前言上一篇文章中,我們利用 Deeplearn.js 學習了 linear regression,從氣溫與紅茶的關聯性中預測銷量,這次就來練習在機器學習中另一個很基本的方法 - Logistic regression(邏輯分析)。 先來張 Demo 成果圖: 從成果圖中可以看出,所謂的 Logistic regression 與 Linear regression 最大不同就是,邏輯回歸大多用來進行分類,當結果只有兩種時,就是二元分

Read More...

在 Ethereum 上開發簡單的 Todo App

前言近一兩年區塊鏈的技術造成一股熱潮,由於加密貨幣在投資上的炒作,常看到的區塊鏈範例都是和虛擬貨幣相關連的服務,另外,技術的應用焦點也常放在金融和會計業上,這是因為這兩個行業長久以來在市場上都有球員兼裁判的嫌疑(例如會計有資產信用背書和被雇用人這兩種矛盾的角色),因此需要一個「備受信任」的機制來重拾市場對它們的信任。而區塊鏈,或是廣義上來說的分散式賬本技術,正是一個有潛力的解法。不過就像《區塊鏈革命》這本書所說的,這個技術實現了「價值上

Read More...