Method
最先進的(SOTA)方法通常是通過監督式學習來訓練的,這需要大量的labeled data。由於標記數資料需要大量的人力和時間成本,尤其是那些需要由專家來標記的資料(如醫學相關),所需要的成本更是難以負擔。Unlabeled data因為不需要標註所以取得相對容易且成本較低,因此如何能有效利用unlabeled data來幫助模型改善成為了熱門的關注領域,Semi-supervised learning可以有效地利用未標記的資料來提高模型的準確性
本方法對於Semi-supervised learning提出了一種新的樣本選擇方法,它可以改進經典的固定閾值方法,使其更加靈活;並結合了M.C. dropout作為noisy label filter,這有助於我們找出那些具有潛在不確定性的偽標籤數據;且可以有效地改善自訓練訓練階段的類不平衡問題和每個類別的準確性。
Usage
TODO: model usage
Release Note
Citation
TODO: Citation information
Acknowledgements
This work was supported in part by the National Science and Technology Council, Taiwan under Grant NSTC 111-2634-F-006-012.
We thank to National Center for High-performance Computing (NCHC) for providing computational and storage resources.