Research Topics

  • Data Mining
  • Big Data Management
  • Crowdsourcing
  • Social Networks
  • Mobile Data Management and Application Development
  • Ubiquitous Computing

Motivation

我們實驗室主要於資料庫查詢處理與資料探勘技術領域進行研究

各種不同資訊平台及其應用所產生的資料,帶著不同的資料屬性與不同的環境應用需求,也產生多樣化的研究議題,持續地推進資料工程(Data Engineering)研究領域向前發展。

而這樣的發展也伴隨資訊技術的更貼近日常生活而有著持續加快的趨勢

Goal

我們以資料工程技術為出發點,考慮各式應用環境中,所產生的資料的查詢處理與探勘。

而就近期研究規劃目標而言,我們規劃三近程研究目標:(1)社群資料分析(Social Data Mining),(2)行動裝置使用者行為探勘(Mobile Data Analysis),(3)文字資料探勘與自然語言處理(Text Mining and Natural Lanuage Processing)。

而就遠程研究重心而言,我們將仍以資料工程知識為核心,配合於各式現有資通平台上所累積之資料分析與查詢處理經驗,朝向未來可預見之更多樣化之平台與資料類型資料管理應用發展

給想加入實驗室的同學

各位同學好 很高興你對我們實驗室感興趣,我們的研究主題為資料探勘, 主要著眼於從資料中找出有用知識, 想要更暸解實驗室與運作模式?, 請直接寄信給 姜力綱學長 "g107056060@smail.nchu.edu.tw" or 蔡秉宏學長 a0963272507@gmail.com

現任成員

YAO-CHUNG FAN

Data Mining, Big Data Management, Social Networks, Mobile Data Management

詹英鴻

江承陽

蔡秉宏

翁湘雲

姜力綱

郭溫蘋

翁偉哲

Publications

what we have done

基於行動裝置使用內容關鍵字探勘之多面向使用者興趣側寫檔研究

本研究計畫擬協同工業技術研究院團隊,延伸前 期計畫成果,延伸發展一個基於行動裝置使用內容短字詞語意分析(Short Text Semantic Understanding)與多面向使用者興趣側寫檔研究之適時適地 IOI(Item-of-Interest)提示系統, 該系統將主動地分析推測使用者之短字詞語意與考量各種面向下之使用者興趣側寫檔,推測行動裝 置使用者當下之可能感興趣項目(Item-of-Interest),來提示使用者希冀提供行動裝置持有者更 智慧化與更即時之智慧型行動裝置服務
(105-106年工業技術研究院斷金計畫, NTD: 2,600,000)

基於電力資料分析之事件偵測研究

於 2014 年迄今,我們協助國立中興大學進行校園用電之量測;由中興資工系同學利用 開源硬體,自行建置電力量測裝置,量測中興大學理學大樓總計十層樓之即時用電資料。利 基於開源硬體與感測裝置技術之普及,我們所建置之電力量測裝置成本低廉,並且具有即時 上網能力,使得大量且廣泛地布建於電力感測器於各樓層空間並密集地記錄每秒鐘之用電量 成為可能。目前我們所建立之平台之詳細用電資料從 2014 年 12 月 10 日收集至今,每層樓 總計 12 個感測器,分別記錄每一層樓中 12 個用電分區之個別每秒鐘用電資料,電力監控範 圍涵蓋教師研究室、授課教室、研究生實驗室及系所辦公室。總計 10 層樓,120 個感測器, 收集資料已逾一年。而除了當初所設定之校園用電量測目標外,我們發現我們所建立之校園 電力監控平台為一個物聯網研究之試金石;即時且密集的電力量測資料,提供我們一個豐富 的資料集,讓我們探索其可能之應用與研究。因此於本研究計畫中,我們擬定探索現有所收 集到之用電資料,並以其於建築空間中事件偵測之可能性進行研究議題探討。
(105-106科技部專題研究計畫 NTD: 702,000)

植基於行動裝置移動軌跡之使用者資訊分析研究

隨著時代的演進,智慧型行動裝置無所不在地融入我們的生活,智慧型行動裝置幾乎隨時隨地的伴隨著使用者,而本計畫著基於前期研究計畫執行過程中了所累積之大量使用者之智慧型行動裝置使用資料,認為探勘分析出使用者之身份資訊、個人興趣、社群關係網路、使用者個人移動習慣將為可能。因此本研究計畫於行動裝置資料探勘角度來切入分析智慧型行動裝置使用者。
(103-105科技部專題研究計畫(兩年期) NTD: 1,616,000)

智慧型行動裝置使用內容關鍵字檢索與探勘研究於適地適時地理活動推薦系統之應用

由於智慧型行動裝置的普及與使用者的高接受程度,智慧型行動裝置幾乎隨時隨地地伴隨著使用者。我們認為智慧型行動裝置不僅僅只是一具迷你隨身電腦,事實上,智慧型行動裝置可視為一行動裝置持有人之資料蒐集器與行為觀察者,行動裝置上所搭載的感測器元件與行動裝置的持有者使用裝置之歷史紀錄提供我們各式各樣極富價值之資料,此種方式之資料蒐集也將更貼近使用者與更無所不在。未來行動運算程式的發展將會整合雲端、行動科技、社會網絡與龐大資料分析等技術產生極大的市場規模與商業價值。通訊產品硬體利潤大幅降低之後,消費性行動應用與服務將是未來行動裝置開發之趨勢。有鑑於此,本研究計畫擬協同工業技術研究院,開發一基於行動裝置使用內容關鍵字檢索與探勘之適時適地地理活動推薦系統,該系統將主動地分析推測使用者之喜好,並根據所推測之結果,即時地推薦行動裝置持有者所在地點附近之可能感興趣活動,希冀提供行動裝置持有者更智慧化與更即時之適地性服務。
(104年工業技術研究院斷金計畫, NTD: 1,661,750)

Mining User Behavior For Better Service Provision to HTC customers

本計畫為一與hTC宏達電子之產學合作研究計畫,由hTC提供120具開發中之智慧型行動裝置發放於大學校園使用,該行動裝置上裝配有資料蒐集app,負責蒐集諸如使用者之行動軌跡、通話資訊、app的使用方式等使用者資料,並計畫透過發展巨量資料探勘技術,來瞭解HTC使用者,提升並改善hTC裝置之開發與良好服務之提供。
(宏達電子hTC產學研發計畫, 兩年期2013.01-2014.12, NTD: 2,676,000. 共同主持)

群眾感測器查詢處理平台最佳化技術研究

本計畫為上述計畫之延續性計畫,並進入102國科會優秀年輕學者研究計畫面試複審,著眼於上述即時地理資訊查詢雛型系統,轉化為實際服務運轉所面臨的技術議題。諸如如何確保查詢處理的效率與結果的品質、如何刺激群眾使用者的參與及大規模應用時的擴充度與海量資料處理等問題。
(群眾感測器查詢處理平台最佳化技術研究, 國科會優秀年輕學者研究計畫決選入圍, Grant No. NSC 102-2221-E-005- 073, NTD 785,000, 102國科會專題研究計畫)

非定量功率電器於非侵入式居家負載辨識研究

本計畫主要探討如何於單點偵測的架構下,使用間接感測之方式估算非定量功率消耗之電器(如電腦與變頻式冷氣機)電力消耗量,此類之電器為現有非侵入式居家負載準確率不佳的主因,因此如何估算其電力消耗,並用之排除非定量功率消耗之電器於整體系統所造成之影響,來提升電器辨識準確率便成為一研究主題。
(半年期2013.07-2013.12, NTD: 175,000.)

以群眾計算為平台之即時地理位置資訊查詢系統及其技術研究

本計畫結合智慧型行動裝置與群眾外包概念(Crowd sourcing),建立一個架構於Amazon Web Service雲端平台上之即時地理資訊查詢系統,提供使用者查詢現有地理資訊系統(如Google Map)所無法提供的具即時性與任意性資訊。
(Grant No. NSC. 101-2218-E-005-003, NTD 541,000. 101國科會專題研究計畫)

Service

try ours api

KCEM

字詞概念推論 (Hyperonym-Hyponym Relationship):例如,五月天是樂團,香蕉是水果,周杰倫是歌手。

Example : http://140.120.13.244/kcem?keyword=周杰倫&lang=zh

情緒分析 swinger

一個自製的判斷中文情緒的函式庫,因為算出來的機率會在0~1之間搖擺,故命名搖擺者,可透過pip安裝 內含已經訓練好的模型

Example : http://140.120.13.244/swinger/swing?sentence=今天真的好高興

KEM

上下文情境相似關聯 (Similar Context Sharing Relationship):例如,輸入周杰倫,將會回傳一系列相似詞,如蔡依林、王力宏、張惠妹等。

Example : http://140.120.13.244/kem?keyword=草履蟲&num=100&lang=zh

TF-IDF

A TF-IDF model using Wikipedia corpus

Example : http://140.120.13.244/tfidf/idf?keyword=中興大學&lang=zh

歷届成員

陳聖軒

文字嵌入模型於文本分類任務之比較研究

黃思穎

一個於儲存空間受限行動裝置上基於文字嵌入模型之物品推薦架構及其通訊成本優化研究

鄭銘毅

基於Context Logs之行動裝置使用者意圖偵測

沃克潘

基於文字嵌入模型之點擊誘餌偵測研究

溫景翔

基於成對比較記錄之物件排名架構及其於商品頁面點擊記錄之應用

陳奕廷

無監督式文字風格轉換-以白話武俠風格為例

游哲軒

基於Attentive Sequence-to-Sequence RNNs的行動裝置使用者意圖理解

劉凱婷

個人化文字嵌入模型與其於個人化文件檢索之應用

王君瑜

一個基於文字語意向量分群架構之文本資料事件追蹤技術

楊尚恩

在職班

陳宜岑

電力資料視覺化異常分析

謝孟樺

考量上下文字詞共現關係之短文斷詞研究

黃子忠

考量野放農園環境下之影像擷取嵌入式裝置設計

李立仁

一個於行動裝置端運算之停留點循序樣型探勘演算法

徐政元

一個以圖形節點中介值為指標之移動式Wi-Fi熱點偵測技術

王美懿

以WIFI服務設定辨識碼為提示依據之記事提醒系統設計與實作