Development of a machine learning based measurement and statistical modeling of neutrophil extracellular traps by using of convolutional neural networks and semi-supervised learning

論文翻譯標題: 應用卷積神經網路和半監督學習開發基於機器學習的嗜中性球細胞外陷阱測量和統計模型
  • 楊 曜嶸

學生論文: Doctoral Thesis

摘要

嗜中性球細胞外陷阱自2004年首次發現,也稱為Neutrophil “NETosis”,是免疫系統對抗微生物的重要免疫反應。使用嗜中性球細胞外陷阱的DNA螢光值配合螢光影像人工計數,來找到不同的藥物介入的與發生嗜中性球細胞外陷阱的相關性,仍然是目前關於嗜中性球細胞外陷阱研究的主要方式,但耗費時間、需要實驗技術。探討嗜中性球細胞外陷阱的研究每年明顯增加,使用自動化且準確有效率的定量方法顯得非常重要。以機器學習應用於嗜中性球細胞外陷阱的研究越來越多,但需要相當大量的樣本數做條件訓練,且主要是探討細胞形態上是否發生嗜中性球細胞外陷阱進而定量,一但發生細胞交疊、時間過長、或是嗜中性球細胞外陷阱太強則不易判讀;本研究希望跳脫大量樣本、型態學、分割和分類的方式,以機器學習合併半監督學習來預測嗜中性球細胞外陷阱的螢光影像輸入(fluorescence image input)與DNA螢光值輸出(value output)之間的關係。 材料與方法 添加SYTOX Green dye,通過螢光顯微鏡觀察嗜中性球細胞外陷阱的形成,並通過分光光度法對其進行觀察。使用螢光讀取器對發生嗜中性球細胞外陷阱的DNA片段進行螢光值定量。本研究提出捲積神經網路的模型,並以tensorflow 2 0在Google Colab實作,由於低倍率下螢光值對視窗輕度偏移敏感性低的假設,經預處理後的影像作?輸入,螢光值作為標記,來訓練模型;因為翻轉和旋轉後螢光值不變的認知,對採樣進行水平和垂直翻轉,1張增多為4張;輸入為336 x 336的256階灰階影像,經過重複4次的conv + BN + ReLU後,接著最後一次的conv + global average pooling + fully connected layer。由於標記資料稀缺,本研究嘗試加入同一實驗室未標記的146張熒光攝影影像用於半監督學習。本研究收集259張樣本,其中113張有標記,隨機分配85張進行全監督學習為模型A,另外28作為測試組。146張沒有標記數值加上模型A的資料進行半監督學習作為為模型B,再以測試組進行模型A和模型B的回歸分析。 結果 兩組模型訓練完成之後進行以測試組進行回歸分析,模型A 、B的R值分別為0 84和0 88;模型A、B的誤差率平均值(95%信賴區間)分別為4 0378% (2 6720~5 4036%),和3 9923 % (2 6324~5 3522%);將這兩個模型誤差值進行paired samples t-test,雖然數值上有差異,半監督學習組結果數值較佳且較為穩定,但是未達到統計上的差異(p= 0 8434)。 結論 使用卷積神經網路結合半監督學習來預測嗜中性球細胞外陷阱螢光影像和DNA螢光值的關係,是準確且有效率的,並且節省時間與樣本數;使用半監督學習習的優勢是使無目標標記、稀少且昂貴的樣本變得可用,且不會傷害模型,本研究顯示數值上性能有提升,雖然未達統計上的差異;未來仍需要更多不同的實驗室配置與樣本進行條件訓練來強化和應證本研究的模型。
獎項日期2021
原文English
監督員Chih-Han Chang (Supervisor)

引用此

'