需同意授權

2020 「科技大擂台 與AI對話」_訓練資料集 Formosa Language Understanding Dataset (FLUD)(2/2)

本資料為2020 「科技大擂台 與AI對話」競賽訓練資料,有意申請者可直接下載。

訓練資料分三個壓縮檔,內容如下:

fgc-training-data-1.zip (簡答題+申論題)

1.含746題訓練題庫文本(基礎簡答題493題、進階簡答題240題,以及申論題13題)。
2.包含以下檔案:
 a.FGC_release_A.json(問題)
 b.FGC_release_A_answers.json(標準答案)
 c.簡答題申論題答題規範

fgc-training-data-2.zip (多輪對話訓練資料)

1.多輪對話的比賽方式為模擬商家客服回答顧客問題,資料集內含20個領域的商家多輪對話訓練資料。
2.包含以下檔案:
 a.20個領域的商家資料表(商家資料內容皆為虛構)
 b.20個領域的多輪對話範例腳本
 c.決賽任務型多輪對話測驗說明  

fgc-mock-test.zip (模擬測試資料)

1.含三次模擬測試的題庫文本,文本包含文章、問題、配分及標準答案,每次測試題庫包含基礎簡答題25題、進階簡答題25題,可供開發集(development set)使用。
2.另附formosa-grand-challenge-2020-baseline,baseline版權歸原作者所有,僅供學習研究之用。
3.包含以下檔案:
 a.FGC_mock_A.json
 b.FGC_mock_B.json
 c.FGC_mock_C.json
 d.formosa-grand-challenge-2020-baseline(提供github連結)

fgc-testing-data.zip (簡答題+申論題,正式比賽考題)

1.2020 「科技大擂台 與AI對話」決賽,含50題題庫文本(基礎簡答題23題、進階簡答題23題,以及申論題4題)。
2.包含以下檔案:
 a.FGC_official_final.json(內含問題及標準答案)

*json檔的參數說明:

參數名稱    說明
  DID      文章編號
  DTEXT      文章內容
  QUESTIONS  同一文章的題組
  QID       題目編號
  QTYPE     題目類型
  QTEXT     題目內容
  QSCORE    問題配分(僅FGC_official_final和fgc-mock-test有此參數)
  ANSWER    標準答案

資料與資源

額外的資訊

欄位
作者 科政中心
維護者 科政中心
最後更新 十月 26, 2020, 10:03 (CST)
建立 六月 8, 2020, 15:00 (CST)

推薦資料集:


  • AU_01_中研院具音段標記之中文對話語音資料庫_抽樣資料

    付費方式 免費
    更新頻率 不定期
    使用條款 使用此資料集前,請詳閱下列條款: 資料庫之電子型式,組成資料內容與型式,著作權屬中央研究院原各著做小組,智慧財產權所有權仍屬中研院所有。 資料庫內容之著作權屬原始著作人所有。 牽涉本條款第一項及第二項著作內容之任何引用之商業行為應與著作權所有人另定約規定之。 如有侵犯資料庫著作權或智慧財產權之行為,應由使用者自行負擔法律責任。...
  • 國軍退除役官兵輔導委員會醫療基金委託調查會費捐助及公益支出表

    付費方式 免費
    更新頻率 不定期
    提供國軍退除役官兵輔導委員會醫療基金委託調查會費捐助及公益支出表資訊
  • 108宜蘭縣冬山鄉土地公告現值

    付費方式 免費
    更新頻率 不定期
    宜蘭縣冬山鄉土地公告現值
  • 110年8月臺南市登革熱病媒蚊密度調查

    付費方式 免費
    更新頻率 不定期
    臺南市登革熱病媒蚊密度調查
  • 警戒水位值影響範圍

    付費方式 免費
    更新頻率 不定期
    水利署災害緊急應變系統為平時或汛期值班應變的核心系統,更是許多相關防災系統的資料供應重要來源,透過系統與資通訊技術達成整備、監控、預警、通報、應變、決策六大任務,可作為防災應變人員之最佳資訊輔助工具,供水利署作為災害應變決策之參考。水利防災中心為統計透過分析水位變化,推估可能受影響的範圍,以利評估相對應防汛作為,產製周期需俟降雨預報進行分析,週期隨情況...