作者(英文):Sung-Lin Tsai
論文名稱(英文):Effectiveness Customizable Model Set Learning Framework and Applications
指導教授(英文):Shiow-Yang Wu
口試委員(英文):Tsung-Ying Sun
Yao-Chung Chang
關鍵詞(英文):big datadeep learningAlexNetVGGNetResNetGoogLeNetsystemic erroreffectiveness customizablemodel set learning
隨著大數據時代的到來和深度學習領域軟硬體的成熟,讓開發出相關應用不再是極為困難的任務。TensorFlow、Keras、PyTorch等主流框架受到全球開發者的歡迎。然而現有深度學習工具的固有缺陷,卻是使用者難以克服的障礙。傳統上高度複雜的多層次演算法形成類似於一個不可打開的黑盒子,最終形成的最佳模型也無法詳細地拆解分析,導致使用者無法自己有效的改進模型。由於訓練數據存在著偏見(bias),再加上模型無法提煉出明確的規律,所以深度學習模型結果一定混雜了部分錯誤的知識,導致產生「系統性錯誤」,以至於無法達到使用者要求的正確率。本篇論文目的在探討現有深度學習工具之分析改進和應用,並提出方法解決現有深度學習的系統性缺陷。我們探討從原始模型預測錯誤的資料中學習次級模型(secondary models),進而以模型集合(model set)提升準確率的深度學習工具改善架構和三種學習方法。前兩種方法是針對所有錯誤的資料去學習次級模型,第三種方法是針對最容易互相混淆的類別去學習次級模型。我們將所提出的架構套用在廣受歡迎的四個不同深度學習工具VGGNet、AlexNet、GoogLeNet、和ResNet上,並以土耳其伊茲密爾的一家超市收集的9種不同的海產品、COVID-19陽性病例的胸部X光圖像資料庫和被診斷為腦瘤的病人的腦部X光圖像組成的不同應用領域資料集進行實驗,測試所提方法的普遍性和準確率,同時比較資料量大小與訓練和預測時間的關係。實驗結果顯示我們的方法確實能有效提升各種深度學習工具的整體準確率,而且增加模型的數量並不會使得訓練和預測時間也跟著爆炸性成長。
With the arrival of big data and the maturity of deep learning software and hardware, the development of related applications is no longer an extremely difficult task. Mainstream frameworks such as TensorFlow, Keras, and PyTorch are popular among developers around the world. However, there are intrinsic problems with existing deep learning tools which cause difficulty in applying them. Traditional highly complex multi-level algorithms form a black box that cannot be opened, and the final model cannot be disassembled and analyzed in detail, making it impossible for users to improve the model effectively on their own. Because of the bias in the training data and the inability of the model to extract explicit laws, the results of the deep learning model are often mixed with some erroneous knowledge, resulting in "systematic errors". The purpose of this thesis is to explore the analytical applications of popular deep learning tools in order to overcome the shortcomings of existing methods. We have proposed three new approaches to improve the accuracy of any existing deep learning tool by extending the original model with secondary models learned from the erroneous data. The first two methods are to learn secondary models from all the erroneous data. The third method is to generate secondary models from the most confusing categories. We tested the accuracy and effectiveness of the proposed methods on four popular deep learning tools and compared the training/prediction time with respect to data size using three different datasets, including a dataset consisting of nine different seafood products collected from a supermarket in Izmir, Turkey, a database of chest X-ray images of COVID-19 positive cases, and brain X-ray images of patients diagnosed with brain tumors. The experimental results show that our methods are effective in improving the overall accuracy, and the additional models does not cause the training/prediction time to explode as well.
第一章 緒論  1
第一節 研究背景與動機 1
第二節 研究目的與方法 2
第三節 研究成果 2
第四節 論文架構 3
第二章 相關研究與技術  5
第一節 AlexNet  5
第二節 VGGNet  6
第三節 ResNet  7
第四節 GoogLeNet  8
第五節 集成學習(Ensemble Learning)  9
第六節 遷移學習(Transfer Learning)  10
第七節 自動編碼器(AutoEncoder)  11
第八節 PyTorch  12
第三章 效能可調式模型學習問題解決策略與方法  13
第一節 現有方法缺失整理  13
第二節 效能可調式模型集合學習策略與研究議題  14
第三節 錯誤模式學習法架構與策略  23
第一項 錯誤模式學習法之研究動機  23
第二項 錯誤模式學習法架構  23
第四節 Softmax指數鑑別法架構與策略  27
第一項 Softmax指數鑑別法之研究動機  27
第二項 Softmax指數鑑別法架構  27
第五節 漸進式錯誤糾正法架構與策略  33
第一項 漸進式錯誤糾正法之研究動機  33
第二項 漸進式錯誤糾正法架構  34
第四章 系統實作與效能評估  41
第一節 實驗環境  41
第二節 實驗資料  42
第三節 實驗結果  43
第一項 錯誤模式學習法(EPLM)實驗結果  43
第二項 Softmax指數鑑別法(SIIM)實驗結果  45
第三項 漸進式錯誤糾正法(IECM)實驗結果  47
第四項 學習方法效能比較  48
第五項 模型訓練和預測時間比較  52
第四節 實驗總結  58
第五章 結論與未來工作  59
第一節 結論  59
第二節 未來工作  60
