需申請審核

2020 「科技大擂台 與AI對話」_訓練資料集 Formosa Language Understanding Dataset (FLUD)(2/2)

本資料為2020 「科技大擂台 與AI對話」競賽訓練資料,有意申請者請詳閱授權條款內容並填寫資訊後送出下載申請,申請將在5個工作天內完成審核,通過審核即可下載。

訓練資料分三個壓縮檔,內容如下:

fgc-training-data-1.zip (簡答題+申論題)

1.含746題訓練題庫文本(基礎簡答題493題、進階簡答題240題,以及申論題13題)。
2.包含以下檔案:
 a.FGC_release_A.json(問題)
 b.FGC_release_A_answers.json(標準答案)
 c.簡答題申論題答題規範

fgc-training-data-2.zip (多輪對話訓練資料)

1.多輪對話的比賽方式為模擬商家客服回答顧客問題,資料集內含20個領域的商家多輪對話訓練資料。
2.包含以下檔案:
 a.20個領域的商家資料表(商家資料內容皆為虛構)
 b.20個領域的多輪對話範例腳本
 c.決賽任務型多輪對話測驗說明  

fgc-mock-test.zip (模擬測試資料)

1.含三次模擬測試的題庫文本,文本包含文章、問題、配分及標準答案,每次測試題庫包含基礎簡答題25題、進階簡答題25題,可供開發集(development set)使用。
2.另附formosa-grand-challenge-2020-baseline,baseline版權歸原作者所有,僅供學習研究之用。
3.包含以下檔案:
 a.FGC_mock_A.json
 b.FGC_mock_B.json
 c.FGC_mock_C.json
 d.formosa-grand-challenge-2020-baseline(提供github連結)

fgc-testing-data.zip (簡答題+申論題,正式比賽考題)

1.2020 「科技大擂台 與AI對話」決賽,含50題題庫文本(基礎簡答題23題、進階簡答題23題,以及申論題4題)。
2.包含以下檔案:
 a.FGC_official_final.json(內含問題及標準答案)

*json檔的參數說明:

參數名稱    說明
  DID      文章編號
  DTEXT      文章內容
  QUESTIONS  同一文章的題組
  QID       題目編號
  QTYPE     題目類型
  QTEXT     題目內容
  QSCORE    問題配分(僅FGC_official_final和fgc-mock-test有此參數)
  ANSWER    標準答案

資料與資源

額外的資訊

欄位
作者 科政中心
維護者 科政中心
最後更新 十月 6, 2020, 10:00 (CST)
建立 六月 8, 2020, 15:00 (CST)

推薦資料集:


  • 科技大擂台_測試資料集 Formosa Language Understanding Dataset (FLUD)(1/2)

    付費方式 免費
    更新頻率 不定期
    現有語音資料量約400小時。 範例試聽:(A-文章、B-問題、C-選項) 選擇題-https://drive.google.com/open?id=18exXfNQdf9Xksq1zxCDTZFIb5_gOqpyD 簡答題-https://drive.google.com/open?id=13QNM8E4_79lzzkBzbf4q7ln3Phxxb5H7
  • 108年11月臺南市登革熱病媒蚊密度調查

    付費方式 免費
    更新頻率 不定期
    108年11月臺南市登革熱病媒蚊密度調查
  • 臺灣地區平均每公頃稻穀生產成本

    付費方式 免費
    更新頻率 不定期
    資料提供包括:年度、期別、成本檔連結等欄位資料。
  • 金融研訓院兩岸業務資訊

    付費方式 免費
    更新頻率 不定期
    兩岸業務資訊(金融研訓院)
  • 法務部國有財產增減結存表-按月

    付費方式 免費
    更新頻率 不定期
    法務部國有財產增減結存表