需申請審核

(3200小時)北科大教育電台廣播節目語音語料庫 NER-Trs-Vol1~17 與 NER-Pro-Vol1~4

[ 費用:1000 or 2000 NTD ]

資料庫名稱:北科大教育電台廣播節目語音語料庫(NER-Trs與NER-Pro)

語音語料庫的原始語音資料來源,是由國立教育廣播電臺所提供的節目音檔。依錄音環境,分為兩類,包括電台錄音室內錄製,無任何背景襯樂或非人聲噪音的『核心語料』,總計約1218.34小時、共1907個檔案;與非錄音室內錄製,或有任何背景襯樂,或非人聲噪音的『非核心語料』,總計約3939.93小時、共4751個檔案。兩者音檔合計約5128.87小時、共6658個檔案數。

詳細原始語音語料統計資料請參閱: http://www.aclclp.org.tw/doc/ner_trs_form.pdf

此原始語音語料,經由臺北科技大學中英夾雜大字彙語音逐字稿轉寫系統(此系統之內部測試字元錯誤率為9.2%),自動轉寫出音檔逐字稿。再經由兩次人工校正後,整理成可供語音辨認使用之語音語料庫。目前共完成『核心語料』總計約624.71小時、共89908個檔案;『非核心語料』總計約2561.07小時、共400495個檔案;『合計約3185.78小時、共4904031個檔案數』。並以一集約150小時語音語料方式,切分成21集,包括:

  • NER-Trs-Vol1~17(語音辨認器先自動產生逐字稿)
  • NER-Pro-Vol1~4(專業聽打員先聽打逐字稿)

詳細語音語料統計資料請參閱: http://www.aclclp.org.tw/doc/ner_pro_form.pdf

授權申請:

上列語料庫已經由臺北科技大學授權社團法人中華民國計算語言學學會發行,申請人需向學會提出申請,簽妥授權使用協議書,並同意確實遵守協議書上之約定條款。 

申請文件及費用:

由服務單位開立身份證明書, 申請單位之申請內文需言明所申請之「北科大教育電台廣播節目語音語料庫」確實僅用於學術、教育及公益研究,不作營利及商業用途。

授權使用協議書(一式兩份):

工本費:

  • NER-Trs-Vol1~17文本:每集NT$1,000元。
  • NER-Trs-Vol1~17音檔:每集NT$1,000元。
  • NER-Pro-Vol1~4文本:每集NT$2,000元。
  • NER-Pro-Vol1~4音檔:每集NT$2,000元。 

備妥申請文件後請郵寄至:

11529台北市研究院路二段128號中研院資訊所(轉) 中華民國計算語言學學會 收 

付款方式:

  • 郵政劃撥:帳號:19166251,戶名:中華民國計算語言學學會
  • 支票:請加註『中華民國計算語言學學會』抬頭
  • 信用卡:請填寫信用卡付款單

其他詳細申請文件及費用說明請參考學會網址:

http://www.aclclp.org.tw/use_mat_c.php#ner

資料與資源

此資料集沒有資料

額外的資訊

欄位
來源 http://www.aclclp.org.tw/
作者 中華民國計算語言學學會
維護者 學會黃秘書
最後更新 一月 3, 2023, 13:26 (CST)
建立 十月 31, 2019, 16:06 (CST)
學會傳真 02-27881638
學會電話 02-27883799#1502

推薦資料集:


  • insight_test_15089

    付費方式 免費
    更新頻率 不定期
  • 服務據點-各縣市工商發展投資策進會資料

    付費方式 免費
    更新頻率 不定期
    各縣市工商發展投資策進會聯絡資料
  • 綜合所得稅各類所得持分之應納稅額占應納稅額各級距申報統計表

    付費方式 免費
    更新頻率 不定期
    綜合所得稅各類所得持分之應納稅額占應納稅額各級距申報統計表 單位:%
  • AU 類自動化技術服務機構登錄合格名單

    付費方式 免費
    更新頻率 不定期
    2014年至2017年通過工業局審查之AU 類自動化服務機構登錄合格業者
  • 原住民族之公司清冊

    付費方式 免費
    更新頻率 不定期
    區分各產業別之原住民族公司清冊。