作者(英文):Hsin-Yueh Su
論文名稱(英文):Research on the Application of Deep Learning in Automatic Identification of a Specific Target from Dynamic Ultrasound Imaging: A Pilot Study using Gallbladder as a Target
指導教授(英文):Ruey-Yi Chang
Tai-Been Chen
口試委員(英文):Yung-Hui Huang
Tai-Been Chen
Sheng-Lung Peng
Jiann-Ming Wu
Ruey-Yi Chang
超音波(ultrasound)是目前應用於腹部急症常見的檢查工具之一,在臨床實務操作上具有非侵入性、無輻射線、低成本、操作靈活且能提供即時影像的優點。但由於不同操作者之間對影像品質的要求、造影參數設定、操作經驗及受檢者的配合程度皆不盡相同,造成超音波影像之對比度與明暗度不一致,使診斷鑑別困難。因此,運用合適的輔助工具以快速取得標的正確的超音波影像,可提升臨床檢查之效率並降低操作門檻。本研究利用錄製30位受檢者之動態超音波影像(MPEG-4格式)轉換成單張靜態影像(JPG格式),挑選出共885張腹部超音波靜態影像,使用卷積神經網路(convolutional neural network, CNN)模型:(i) visual geometry group-19 (VGG-19)、(ii) VGG-19結合support vector machine (SVM)、(iii) VGG-19轉移學習模型及(iv) ResNet50轉移學習模型共四種類型,進行自動辨識腹部超音波靜態影像視野(field of view, FOV)內之膽囊影像,並比較各模型分類結果,找出最佳分類模型。模型效能評比項目包含準確度、靈敏度、特異性、陽性預測值(positive predicted value, PPV)、陰性預測值(negative predicted value, NPV)及一致性係數(Kappa)。實驗結果證明經轉移學習之VGG-19與ResNet50模型最佳,其準確度、靈敏度、特異性、PPV、NPV及Kappa值皆顯著提升(皆大於98%)。本研究利用錄製人體腹部超音波之動態影像,經由人工智慧(artificial intelligence, AI)建構影像自動辨識及分類模型,以輔助經驗不足的操作者能在較短時間內獲得所需之影像,並滿足無法配合閉氣者之造影需求,研究結果可應用於救護車上裝備做為病患到院前之診斷。
Ultrasound is one of the common inspection tools commonly used in abdominal emergencies. It has the advantages of non-invasive, no radiation, low cost, flexible operation and can provide real-time images in clinical practice. However, due to complexity of parameter setting, experience of the operator, and uncooperative of the patient usually resulting in bad quality of images. In this study, I recorded the dynamic ultrasound images (MPEG-4 format) from 30 subjects and converted into a single static image (JPG format) to obtain 885 ultrasound images from the abdomen. Four convolutional neural network (CNN) models including (i) Visual Geometry Group-19 (VGG-19), (ii) VGG-19 in conjunction with Support Vector Machine (SVM), (iii) transfer learning from VGG-19, and (iv) transfer learning from ResNet50 were applied to automatically identify the ultrasound static images of gallbladder in the field of view (FOV). The accuracy, sensitivity, specificity, positive predicted value (PPV), negative predicted value (NPV), and Kappa value among four models were compared respectively. Transfer learning from VGG-19 and ResNet50 models revealed the best outcome. These results indicated that combination of VGG-19 and ResNet50 models could be used to establish deep learning algorithm for acquiring dynamic images of ultrasound. The disadvantages of ultrasound can be solved by using recording dynamic images of the abdomen through artificial intelligence (AI) to construct automatic image recognition and classification models. These models can be used to assist inexperienced operators and to obtain high quality images in a shorter time. This method could also be further expanded on ambulances so that emergency physicians can perform pre-medical treatment before patients arrive at the hospital.
第一章 緒論 1
第一節 前言 1
第二節 超音波造影原理 3
第三節 影像辨識原理 6
第四節 研究動機與目的 9
第二章 文獻探討 11
第一節 影像辨識於醫學影像之應用 11
第二節 動態造影於臨床影像之應用 13
第三節 卷積神經網路(convolution neural network, CNN) 15
第四節 CNN模型 17
第三章 研究方法與步驟 21
第一節 研究流程 21
第二節 造影條件 21
第三節 影像前處理 23
第四節 VGG-19模型 23
第五節 SVM分類器 25
第六節 轉移學習 26
第七節 評估模型之方法 28
第四章 結果 33
第一節 MPEG超音波影像擷取暨分類結果 33
第二節 轉移學習模型分類結果 35
第三節 轉移學習模型訓練分析 37
第四節 多次訓練模型之結果 47
第五節 ResNet50轉移學習全數據集實驗結果 49
第六節 結論 50
第五章 討論 51
第一節 討論 51
第一節 研究限制 56
第一節 未來研究方向 57
參考文獻 59
附錄一 VGG-19層數設計及其參數 67
附錄二 轉移學習之ResNet50層數設計及其參數 69
附錄三 VGG-19、VGG-19+SVM及ResNet50轉移學習模型100次訓練結果 77
