2023年5月16日 星期二

Wikidata dump

我的研究領域是自然語言問答系統,在我專研的問答系統是需要一個知識庫,這跟另一種問答系統 -- Stanford 的 SQUAD -- 不同。我需要的知識庫都是從 Wikipedia 轉出來的,並且以 RDF 的格式儲存,以便於使用者利用 SPARQL 語法進行查詢。

早期的知識庫有幾種,但是後來由 DBpedia 勝出。再經過幾年,這個知識庫的競賽中,似乎慢慢的有一個名為 Wikidata 的知識庫浮出檯面,因此我被迫需要去了解一下 Wikidata 的查詢平台要如何建立,才不會受限於官方的種種限制。

2023年2月25日 星期六

究竟 nVidia Gefore GTX 1060 在 TensorFlow-gpu 的表現如何? (Part 3)

照理說,這次的標題是下錯的,因為這次是想要測試一下 nVidia Gefore GTX 1060 在微軟的 Windows Subsystem for Linux (WSL 2) 利用所謂的 DirectML 來開發 tensorflow 2(或者說,在 WSL 2 下能夠使用 GPU 來發揮 tensorflow 2)的程式。但是由於是心得式的文章,我就以 Part 3 來延續這個主題。另外,我想知道,如果以之前安裝的純 tensorflow-gpu 2.3 版來比較,DirectML 的架構效能究竟是怎麼樣的情形。

經過了兩年,我簡單的試圖在 win10 的環境下再次利用 anaconda 3 架設 Tensorflow-GPU 的環境,結果還是不很成熟,我真心認為安裝的過程很沒必要東拿西挪的,直覺式的 conda install 就應該要能做的到,很不幸的,目前最直覺的安裝方式還是幾年前試出來的 tensorflow-gpu 2.3 版。

前幾天學生告訴我,在 win10/win11 的環境下未來的趨勢似乎是 WSL 的天下(雖然我的直覺告訴我,台灣一般資管系的學生比較難接受 Linux),所以我就試了一下所謂的 WSL 2。我幾年前就試過所謂的 WSL,但是可能是所謂的 WSL 1,所以效能不怎麼樣,我就放棄了;這次嘗試 WSL 2,我有了截然不同的體驗,所以安裝完了 WSL 2 就下手嚐試 tensorflow-gpu。

2023年2月2日 星期四

ChatGPT 的快速筆記

好久沒更新這個部落格了。最近因為 ChatGPT 的興起,促使我動念玩了一下;雖然說 ChatGPT 很有趣,但是距離我想要做的東西還是有一些差距。玩的過程,一開始是使用官網上的介面,似乎是每個帳號可以有三個月的免費試用,之後會收費;至於如何收費,我沒深入去瞭解。我建議對 ChatGPT 有興趣的客官,可以先去試玩一下;試玩的過程,你需要登記成為免費會員,並且依據步驟你也會申請到一個 API key。請把這個 API key 放在一個隨手可得的地方(但是不要讓他人知道,我相信未來的收費機制是根據這把 API key 的),在之後的步驟會需要。

然後東翻西找我心裡面想要做的東西,突然發現了幾個 github 的網站:

1. @waylaidwanderer/chatgpt-api

2. acheong08/ChatGPT 

我暫時先跑了第一個網站的內容。由於我的電腦安裝的是 Windows 10 的作業系統,為了可以玩 ChatGPT API,我必須先安裝 Node.jsGit,請分別點擊連結來安裝。我是利用 winget 的方式安裝 Node.js,而 git 更是大家熟悉的安裝包。

首先,我們先利用 git 把 ChatPGT API 的內容複製到你的電腦,作法就是新增一個放置 ChatGPT API 的目錄,然後在該目錄下執行:git clone https://www.npmjs.com/package/@waylaidwanderer/chatgpt-api。這些指令我是在所謂的 Node.js command prompt 內執行的(如下圖),意思是說你至少要會一些指令式的操作。

2020年4月22日 星期三

究竟 nVidia Gefore GTX 1060 在 TensorFlow-gpu 的表現如何? (Part 2)

[最新更新:05/14/2020]

真的好久好久沒有更新科普的文章了,而且看了一下 Part 1 的完成時間,居然是在 2019 年的 2 月,時間已經整整流失了一年多。其中有一項重要的發展,Tensorflow 已經從 1.x 版大改版的升級到 2.x 版,因此這次測試的文章是以 2.x 進行的。

這次測試的也不再使用 baby 級的程式,而是自然語言處理(Natural Language Processing)中情緒分析(Sentiment Analysis)的程式。基本上,我是參考 Perform sentiment analysis with LSTMs, using TensorFlow 這篇文章內 Tensorflow 1.x 版的程式並將其改寫成 2.x 的程式。 順便提一下,這篇文章寫得相當好;如果你對於情緒分析的主題有興趣的話,非常值得一讀。

我實驗的環境跟 Part 1 一樣,因此這裡不再贅述。軟體環境是 Anaconda;一定要提的是:自從 Tensorflow 2.x 釋出之後,目前利用 Anaconda 安裝 2.x 非常簡單,簡單到完全不必另外手動安裝 cuda 之類的套件。深度學習的架構是隱藏層是 LSTM,輸出層就是一般常用的 Dense,總共使用 50000 筆資料中的 25000 筆進行訓練,批次訓練的數量是 64 筆。


2019年2月25日 星期一

究竟 nVidia Gefore GTX 1060 在 TensorFlow-gpu 的表現如何? (Part 1)

檢視一下,我已經好久、好久沒有撰寫科普文章了。過去幾年研究主題到處流浪,我想過去流浪的各種研究內容寫出來應該不怎麼科普,所以這個部落格的內容就沒有更新。從去年起,tensorflow-gpu 吸引許多人的注意,我也想買一套設備試一試,可是每一種的效能如何,居然從 google 中找不到太多的幫助(各種 benchmark 的跑分,對我的幫助不大)。前一陣子兒子"退役"了一片顯卡(所謂的低階遊戲卡),看了一下包裝:耶,居然是支援 cuda 的 nVidia 顯卡,於是我就拿來測試一下。[如果有廠商願意提供設備給我,我倒是願意多跑幾種比較精準的實驗]

我跑的作業系統是 windows 10,硬體安裝的過程不談,tensorflow-gpu 的安裝方式也不談,大家 google 一下應該都可以找到。我們直接看實驗的硬體平台,首先是 CPU 的部分,這個以 cpuz 的畫面就可以明白: