需申請審核

H11-M08_漸進式資料標註更正的自主學習模型

Method

最先進的(SOTA)方法通常是通過監督式學習來訓練的,這需要大量的labeled data。由於標記數資料需要大量的人力和時間成本,尤其是那些需要由專家來標記的資料(如醫學相關),所需要的成本更是難以負擔。Unlabeled data因為不需要標註所以取得相對容易且成本較低,因此如何能有效利用unlabeled data來幫助模型改善成為了熱門的關注領域,Semi-supervised learning可以有效地利用未標記的資料來提高模型的準確性 本方法對於Semi-supervised learning提出了一種新的樣本選擇方法,它可以改進經典的固定閾值方法,使其更加靈活;並結合了M.C. dropout作為noisy label filter,這有助於我們找出那些具有潛在不確定性的偽標籤數據;且可以有效地改善自訓練訓練階段的類不平衡問題和每個類別的準確性。

Usage

TODO: model usage

Release Note

  • v1.0.0, 2023/07/21

Citation

TODO: Citation information

Acknowledgements

This work was supported in part by the National Science and Technology Council, Taiwan under Grant NSTC 111-2634-F-006-012. We thank to National Center for High-performance Computing (NCHC) for providing computational and storage resources.

資料與資源

額外的資訊

欄位
作者
維護者
版本 1.0.0
最後更新 十月 5, 2023, 19:44 (CST)
建立 七月 21, 2023, 10:53 (CST)
聯繫Email email@address.org
聯繫窗口 someone

推薦資料集:


  • 大陸委員會主管大陸事務財團法人名冊

    付費方式 免費
    更新頻率 不定期
    列示聯絡名冊
  • 國有林盜伐樣態與高風險地點

    付費方式 免費
    更新頻率 不定期
    提供國有林盜伐樣態與高風險地點分布資訊,資料欄位包含:盜伐樣態、座標資訊(含TWD97/121分帶座標系統之X、Y座標及WGS84經緯度座標等2種資訊)及盜伐標的等。
  • 事業廢棄物再利用申報量統計

    付費方式 免費
    更新頻率 不定期
    以列管產源之所在地作為統計主軸,統計事業廢棄物進行再利用之申報量。
  • 108年第2季花蓮縣印花稅徵收--2

    付費方式 免費
    更新頻率 不定期
    108年第2季花蓮縣印花稅徵收-2
  • 10411-01-04-2 臺中市高級中等學校學生年齡別統計-實用技能學程

    付費方式 免費
    更新頻率 不定期
    臺中市高級中等學校學生年齡別統計-實用技能學程