需申請審核

H11-M08_漸進式資料標註更正的自主學習模型

Method

最先進的(SOTA)方法通常是通過監督式學習來訓練的,這需要大量的labeled data。由於標記數資料需要大量的人力和時間成本,尤其是那些需要由專家來標記的資料(如醫學相關),所需要的成本更是難以負擔。Unlabeled data因為不需要標註所以取得相對容易且成本較低,因此如何能有效利用unlabeled data來幫助模型改善成為了熱門的關注領域,Semi-supervised learning可以有效地利用未標記的資料來提高模型的準確性 本方法對於Semi-supervised learning提出了一種新的樣本選擇方法,它可以改進經典的固定閾值方法,使其更加靈活;並結合了M.C. dropout作為noisy label filter,這有助於我們找出那些具有潛在不確定性的偽標籤數據;且可以有效地改善自訓練訓練階段的類不平衡問題和每個類別的準確性。

Usage

TODO: model usage

Release Note

  • v1.0.0, 2023/07/21

Citation

TODO: Citation information

Acknowledgements

This work was supported in part by the National Science and Technology Council, Taiwan under Grant NSTC 111-2634-F-006-012. We thank to National Center for High-performance Computing (NCHC) for providing computational and storage resources.

資料與資源

額外的資訊

欄位
作者
維護者
版本 1.0.0
最後更新 十月 5, 2023, 19:44 (CST)
建立 七月 21, 2023, 10:53 (CST)
聯繫Email email@address.org
聯繫窗口 someone

推薦資料集:


  • 新北市公告得免個案指定建築線地區

    付費方式 免費
    更新頻率 不定期
    新北市公告得免個案指定建築線地區
  • 澎湖(馬公)商港歷年海氣象觀測月統計資料

    付費方式 免費
    更新頻率 不定期
    提供澎湖(馬公)商港歷年風波流月統計資料。
  • 需申請審核

    QIN LUNG CT

    付費方式 免費
    更新頻率 不定期
    The Computed tomography (CT) Image data was obtained on patients diagnosed with Non-Small Cell Lung Cancer (NSCLC) with mixed stage & histology from the H. Lee Moffitt...
  • 109年臺南市建物第一次登記統計表

    付費方式 免費
    更新頻率 不定期
    年月、區名、六層以下-筆數、六層以下-面積M2、七層以上-筆數、七層以上-面積M2
  • 總碳氫化合物(THC)監測小時值(每小時提供)

    付費方式 免費
    更新頻率 不定期
    提供總碳氫化合物(THC)監測小時值(每小時提供)