需申請審核

(3200小時)北科大教育電台廣播節目語音語料庫 NER-Trs-Vol1~17 與 NER-Pro-Vol1~4

[ 費用:1000 or 2000 NTD ]

資料庫名稱:北科大教育電台廣播節目語音語料庫(NER-Trs與NER-Pro)

語音語料庫的原始語音資料來源,是由國立教育廣播電臺所提供的節目音檔。依錄音環境,分為兩類,包括電台錄音室內錄製,無任何背景襯樂或非人聲噪音的『核心語料』,總計約1218.34小時、共1907個檔案;與非錄音室內錄製,或有任何背景襯樂,或非人聲噪音的『非核心語料』,總計約3939.93小時、共4751個檔案。兩者音檔合計約5128.87小時、共6658個檔案數。

詳細原始語音語料統計資料請參閱: http://www.aclclp.org.tw/doc/ner_trs_form.pdf

此原始語音語料,經由臺北科技大學中英夾雜大字彙語音逐字稿轉寫系統(此系統之內部測試字元錯誤率為9.2%),自動轉寫出音檔逐字稿。再經由兩次人工校正後,整理成可供語音辨認使用之語音語料庫。目前共完成『核心語料』總計約624.71小時、共89908個檔案;『非核心語料』總計約2561.07小時、共400495個檔案;『合計約3185.78小時、共4904031個檔案數』。並以一集約150小時語音語料方式,切分成21集,包括:

  • NER-Trs-Vol1~17(語音辨認器先自動產生逐字稿)
  • NER-Pro-Vol1~4(專業聽打員先聽打逐字稿)

詳細語音語料統計資料請參閱: http://www.aclclp.org.tw/doc/ner_pro_form.pdf

授權申請:

上列語料庫已經由臺北科技大學授權社團法人中華民國計算語言學學會發行,申請人需向學會提出申請,簽妥授權使用協議書,並同意確實遵守協議書上之約定條款。 

申請文件及費用:

由服務單位開立身份證明書, 申請單位之申請內文需言明所申請之「北科大教育電台廣播節目語音語料庫」確實僅用於學術、教育及公益研究,不作營利及商業用途。

授權使用協議書(一式兩份):

工本費:

  • NER-Trs-Vol1~17文本:每集NT$1,000元。
  • NER-Trs-Vol1~17音檔:每集NT$1,000元。
  • NER-Pro-Vol1~4文本:每集NT$2,000元。
  • NER-Pro-Vol1~4音檔:每集NT$2,000元。 

備妥申請文件後請郵寄至:

11529台北市研究院路二段128號中研院資訊所(轉) 中華民國計算語言學學會 收 

付款方式:

  • 郵政劃撥:帳號:19166251,戶名:中華民國計算語言學學會
  • 支票:請加註『中華民國計算語言學學會』抬頭
  • 信用卡:請填寫信用卡付款單

其他詳細申請文件及費用說明請參考學會網址:

http://www.aclclp.org.tw/use_mat_c.php#ner

資料與資源

此資料集沒有資料

額外的資訊

欄位
來源 http://www.aclclp.org.tw/
作者 中華民國計算語言學學會
維護者 學會黃秘書
最後更新 一月 3, 2023, 13:26 (CST)
建立 十月 31, 2019, 16:06 (CST)
學會傳真 02-27881638
學會電話 02-27883799#1502
DOI 10.30193/scidm-ds-79w9840

Citation


推薦資料集:


  • 營運明細資料表

    付費方式 免費
    更新頻率 不定期
    提供資料包含:檔案名稱、連結、更新日期等欄位資訊。
  • 保險安定基金動態

    付費方式 免費
    更新頻率 不定期
    保險安定基金動態內容(財團法人保險安定基金)
  • 不動產經紀人訓練機構

    付費方式 免費
    更新頻率 不定期
    不動產經紀人訓練機構
  • 新北市路邊收費停車場收費路段資訊-五股區

    付費方式 免費
    更新頻率 不定期
    包含板橋、新莊、三重、永和、中和、新店、土城、海山、蘆洲、樹林、鶯歌、三峽、汐止、林口、淡水、八里等地區路邊收費停車場收費路段資訊-五股區
  • 新北市景點遊客人次統計(不含中央所屬北觀處及東北角管理處之統計資訊)

    付費方式 免費
    更新頻率 不定期
    新北市景點遊客人次統計(自104年起算),其資料包含景點名稱、1-12月份及各月份總計之遊客統計資訊。但資料內容不含中央所屬北觀處及東北角管理處管轄之景點人次。