近幾年,由於圖卷積網路(Graph Convolution Network,GCN) 的出現,被大量應用在圖形(graph) 資料上,能夠不單使用本身的資訊,也能同時考慮在圖形中與自己相連點資訊,對於模型的學習提供更多的訊息,例如社群網路、通訊網路和蛋白質網路,在過去的研究都有突出的模型表現。然而,圖卷積網路(GCN) 卻較少運用在序列資料的處理上。關於序列資料,一般常見的為時間序列,而由於科技的進步,使得感測(sensors) 廣泛運用在城市中,例如空氣品質監控、腳踏車流量管理、交通流量控管,同時也獲取?多感測器的序列型態紀錄,因此,對於利用時間序列資料的預測更為受到重視且可行。又由於網際網路的盛行,網路使用者在社群媒體平台頻繁的互動,資訊不斷的在網路上散布,同時也就產生了社群媒體的序列,例如轉傳文章貼文的序列,而近幾年來在社群網路上,假新聞的議題受到極大的關注,文章貼文文字序列以及轉傳使用者序列或?隱含著假新聞的資訊。因此,本研究將結合圖卷積網路(GCN) 的優點和深度學習的架構,針對兩種不同序列型態的資訊: 時間序列與社群媒體序列,分別根據其形態建立兩種模型,Attention-adjusted Graph Spatio-Temporal Network(AGSTN) 與Graph-aware Co-Attention Network(GCAN)模型來進行序列表示學習以及預測。 針對AGSTN 模型,利用多層圖卷積網路(Multi-Graph Convolutional Network,MGCN) 來學習感測器間隨著時間變化的空間與時間相關性,以及利用注意力(attention) 機制來進行調整,使得預測值在隨著時間變動幅度不定的情況下,能夠更趨於合適的範圍預測數值。模型應用在三種資料集上,分別為空氣品質序列、腳踏車需求序列、交通序列,皆有顯著的預測表現且優於過去的模型;針對GCAN模型,將社群媒體序列應用於假新聞偵測問題上,利用短篇文章貼文的文字序列和轉傳使用者序列,以較貼近真實的情況下進行假新聞的預測,利用圖卷積網路(GCN)學習轉傳使用者間的相互關係,結合深度學習(deep learning) 的序列模型進行預測,且藉由雙重共同注意力(dual co-attention)機制針對預測為假新聞的原因進行解釋,實驗於兩個真實的推(Twitter) 資料集上,模型表現皆優於過去的模型。
Graph Neural Network-enhanced Sequential Learning for Time Series and Social Media Prediction
易儒, 呂. (Author). 2020
學生論文: Doctoral Thesis