作者(英文):Chi-Ying Hsiang
論文名稱(英文):Analyzing Financial Statement Manipulation by Using Machine Learning
指導教授(英文):Torng-Her Lee
口試委員(英文):Ting-Son Wang
Wo-Chiang Lee
關鍵詞(英文):Financial statement manipulationData miningMachine learningSupport vector machineRandom forest
本研究主要探討機器學習方法(machine learning)在財務報表操控上的應用,以2001年至2016年間64間被證管會要求重編財報之國內公開發行公司(含上市、上櫃公司)與128間配對公司作為研究樣本,並使用支援向量機(support vector machine)、邏輯迴歸(logistic regression)與隨機森林(random forest)建立財務報表重編偵測模型並進行分析、比較。
本研究實證結果發現,以逐步迴歸分析法(stepwise regression)進行變數篩選,再運用隨機森林建立之模型具有最好的平均準確率與最低的第二型錯誤,其平均準確率為85.93%、第二型錯誤率為26.57%。此外研究顯示邏輯迴歸建立模型的分類準確率為3種資料分析方法中最差的。
This study explores the effectiveness of Machine Learning in analyzing financial statement manipulation. This study uses machine learning algorithms, including Support Vector Machine, Logistic Regression, and Random Forest to analyze 64 companies that restated financial statements and 128 non-restated companies in the period of 2001-2016.
The result of this study shows that the best performance model is using Stepwise Regression for variable screening and Random Forest for model building. The average accuracy rate is 85.93%. However, the result also shows that Type I errors of all six models don’t perform well.
第一章 緒論 1
第一節 研究背景 1
第二節 研究目的 2
第三節 研究大綱 3
第四節 研究流程 4
第二章 文獻回顧 5
第一節 財務報表操控相關研究 5
第二節 財務報表操控相關研究之總匯表 9
第三章 研究方法 13
第一節 研究架構 13
第二節 資料分析方法 14
第三節 資料來源與樣本選擇 16
第四節 變數定義與變數選取 17
第四章 資料分析 19
第一節 敘述性統計分析與相關資料統計 19
第二節 逐步迴歸分析法篩選變數 20
第三節 機器學習方法之分析(逐步迴歸篩選之變數) 23
第四節 簡單貝氏分類法篩選變數 28
第五節 機器學習方法之分析(簡單貝氏分類法篩選之變數) 30
第六節 比較分析結果 36
第五章 研究結論與建議 39
第一節 研究結論 39
第二節 研究限制與建議 40
附錄、額外分析 41
參考文獻 43
