需申請審核

H11-M08_漸進式資料標註更正的自主學習模型

Method

最先進的(SOTA)方法通常是通過監督式學習來訓練的,這需要大量的labeled data。由於標記數資料需要大量的人力和時間成本,尤其是那些需要由專家來標記的資料(如醫學相關),所需要的成本更是難以負擔。Unlabeled data因為不需要標註所以取得相對容易且成本較低,因此如何能有效利用unlabeled data來幫助模型改善成為了熱門的關注領域,Semi-supervised learning可以有效地利用未標記的資料來提高模型的準確性 本方法對於Semi-supervised learning提出了一種新的樣本選擇方法,它可以改進經典的固定閾值方法,使其更加靈活;並結合了M.C. dropout作為noisy label filter,這有助於我們找出那些具有潛在不確定性的偽標籤數據;且可以有效地改善自訓練訓練階段的類不平衡問題和每個類別的準確性。

Usage

TODO: model usage

Release Note

  • v1.0.0, 2023/07/21

Citation

TODO: Citation information

Acknowledgements

This work was supported in part by the National Science and Technology Council, Taiwan under Grant NSTC 111-2634-F-006-012. We thank to National Center for High-performance Computing (NCHC) for providing computational and storage resources.

資料與資源

額外的資訊

欄位
作者
維護者
版本 1.0.0
最後更新 十月 5, 2023, 19:44 (CST)
建立 七月 21, 2023, 10:53 (CST)
聯繫Email email@address.org
聯繫窗口 someone

推薦資料集:


  • 臺閩地區房屋稅使用類別稅額統計表

    付費方式 免費
    更新頻率 不定期
    臺閩地區房屋稅使用類別稅額統計表
  • 高雄市政府109年度環境水體監測資料

    付費方式 免費
    更新頻率 不定期
    Name(測站名稱)、NO(測站編號)、Date(監測日期)、Temperature(氣溫℃)、Water_temperature(水溫℃)、Salt(鹽度psu)、pH(酸鹼度)、Conductivity(導電度μmho/cm)、Suspended_solids(懸浮固體mg/L)、COD(化學需氧量mg/L)、BOD5(生化需氧量mg/L)、Dis...
  • 林務局所轄自然步道軌跡圖-016_茂興懷舊步道

    付費方式 免費
    更新頻率 不定期
    提供林務局所轄自然步道軌跡圖-016_茂興懷舊步道KMZ下載檔案。
  • 出院後三日以內同院所再急診率(醫院總額指標)

    付費方式 免費
    更新頻率 不定期
    資料來源:保險醫事服務機構醫療服務點數申報資料 分子:三日內再到同院急診的案件數。 分母:出院案件數。 計算公式:(分子/分母)X100%
  • 台中市公司登記資料-I專業、科學及技術服務業

    付費方式 免費
    更新頻率 不定期
    提供台中市公司營業項目為I專業、科學及技術服務業之登記資料及營業地址。