由於網際網路包含豐富的資訊,可以將這些資訊建構成一個異質資訊網路,但因為其中可能包含?多不需要的信息,要如何從中挖掘出真正有用的資訊,是值得我們探討的問題,期望可以設計一套方法,從網路中取得重要的資訊,以了解節點之間的相關性。我們的任務是預測用戶的社交連結(UU-LP),以及用戶與項目之間的連結(UI-LP),倘若能夠精確預測兩者之間的關係,表示該方法能夠正確捕捉到節點之間的相關性,進而可用於商品推薦等等。我們提出了兩種強化異質資訊網路中的特徵表示學習方法:metamotif2vec與diversewalk2vec,metamotif2vec設計一個結構性的隨機遊走,可以同時考量較多不同類型節點之間的關係,而diversewalk2vec則是設計多樣性的隨機遊走,不用事先定義隨機遊走的形式,透過讓路徑通過多種類型的節點,自動捕捉其中的相關性,且可設定一參數讓隨機遊走可以傾向在同質網路或是異質網路中進行。我們在Twitter打卡紀錄及Douban Book兩筆資料進行實驗,相比於目前最先進的異質網路表示學習方法metapath2vec,我們提出的diversewalk2vec與metamotif2vec在UU-LP及UI-LP的任務中,平均可分別獲得7 1%與5 2%的精確率提升。而網路雖帶來了生活便利性,但也產生了隱私風險的問題,因此我們設計一套擾動資料的防禦機制,同時也進行連結預測的實驗,評估防禦機制的有效性,結果顯示其確實能使預測精確率下降,因此能夠降低用戶個人隱私外洩的可能性。
Enhanced Feature Learning with Its Applications to Link Prediction and Defense in Heterogeneous Information Networks
薇筑, 王. (Author). 2019
學生論文: Doctoral Thesis