本資料為2020 「科技大擂台 與AI對話」競賽訓練資料,有意申請者可直接下載。
訓練資料分三個壓縮檔,內容如下:
fgc-training-data-1.zip (簡答題+申論題)
1.含746題訓練題庫文本(基礎簡答題493題、進階簡答題240題,以及申論題13題)。
2.包含以下檔案:
a.FGC_release_A.json(問題)
b.FGC_release_A_answers.json(標準答案)
c.簡答題申論題答題規範
fgc-training-data-2.zip (多輪對話訓練資料)
1.多輪對話的比賽方式為模擬商家客服回答顧客問題,資料集內含20個領域的商家多輪對話訓練資料。
2.包含以下檔案:
a.20個領域的商家資料表(商家資料內容皆為虛構)
b.20個領域的多輪對話範例腳本
c.決賽任務型多輪對話測驗說明
fgc-mock-test.zip (模擬測試資料)
1.含三次模擬測試的題庫文本,文本包含文章、問題、配分及標準答案,每次測試題庫包含基礎簡答題25題、進階簡答題25題,可供開發集(development set)使用。
2.另附formosa-grand-challenge-2020-baseline,baseline版權歸原作者所有,僅供學習研究之用。
3.包含以下檔案:
a.FGC_mock_A.json
b.FGC_mock_B.json
c.FGC_mock_C.json
d.formosa-grand-challenge-2020-baseline(提供github連結)
fgc-testing-data.zip (簡答題+申論題,正式比賽考題)
1.2020 「科技大擂台 與AI對話」決賽,含50題題庫文本(基礎簡答題23題、進階簡答題23題,以及申論題4題)。
2.包含以下檔案:
a.FGC_official_final.json(內含問題及標準答案)
*json檔的參數說明:
參數名稱 說明
DID 文章編號
DTEXT 文章內容
QUESTIONS 同一文章的題組
QID 題目編號
QTYPE 題目類型
QTEXT 題目內容
QSCORE 問題配分(僅FGC_official_final和fgc-mock-test有此參數)
ANSWER 標準答案