需申請審核

(3200小時)北科大教育電台廣播節目語音語料庫 NER-Trs-Vol1~17 與 NER-Pro-Vol1~4

[ 費用:1000 or 2000 NTD ]

資料庫名稱:北科大教育電台廣播節目語音語料庫(NER-Trs與NER-Pro)

語音語料庫的原始語音資料來源,是由國立教育廣播電臺所提供的節目音檔。依錄音環境,分為兩類,包括電台錄音室內錄製,無任何背景襯樂或非人聲噪音的『核心語料』,總計約1218.34小時、共1907個檔案;與非錄音室內錄製,或有任何背景襯樂,或非人聲噪音的『非核心語料』,總計約3939.93小時、共4751個檔案。兩者音檔合計約5128.87小時、共6658個檔案數。

詳細原始語音語料統計資料請參閱: http://www.aclclp.org.tw/doc/ner_trs_form.pdf

此原始語音語料,經由臺北科技大學中英夾雜大字彙語音逐字稿轉寫系統(此系統之內部測試字元錯誤率為9.2%),自動轉寫出音檔逐字稿。再經由兩次人工校正後,整理成可供語音辨認使用之語音語料庫。目前共完成『核心語料』總計約624.71小時、共89908個檔案;『非核心語料』總計約2561.07小時、共400495個檔案;『合計約3185.78小時、共4904031個檔案數』。並以一集約150小時語音語料方式,切分成21集,包括:

  • NER-Trs-Vol1~17(語音辨認器先自動產生逐字稿)
  • NER-Pro-Vol1~4(專業聽打員先聽打逐字稿)

詳細語音語料統計資料請參閱: http://www.aclclp.org.tw/doc/ner_pro_form.pdf

授權申請:

上列語料庫已經由臺北科技大學授權社團法人中華民國計算語言學學會發行,申請人需向學會提出申請,簽妥授權使用協議書,並同意確實遵守協議書上之約定條款。 

申請文件及費用:

由服務單位開立身份證明書, 申請單位之申請內文需言明所申請之「北科大教育電台廣播節目語音語料庫」確實僅用於學術、教育及公益研究,不作營利及商業用途。

授權使用協議書(一式兩份):

工本費:

  • NER-Trs-Vol1~17文本:每集NT$1,000元。
  • NER-Trs-Vol1~17音檔:每集NT$1,000元。
  • NER-Pro-Vol1~4文本:每集NT$2,000元。
  • NER-Pro-Vol1~4音檔:每集NT$2,000元。 

備妥申請文件後請郵寄至:

11529台北市研究院路二段128號中研院資訊所(轉) 中華民國計算語言學學會 收 

付款方式:

  • 郵政劃撥:帳號:19166251,戶名:中華民國計算語言學學會
  • 支票:請加註『中華民國計算語言學學會』抬頭
  • 信用卡:請填寫信用卡付款單

其他詳細申請文件及費用說明請參考學會網址:

http://www.aclclp.org.tw/use_mat_c.php#ner

資料與資源

此資料集沒有資料

額外的資訊

欄位
來源 http://www.aclclp.org.tw/
作者 中華民國計算語言學學會
維護者 學會黃秘書
最後更新 一月 3, 2023, 13:26 (CST)
建立 十月 31, 2019, 16:06 (CST)
學會傳真 02-27881638
學會電話 02-27883799#1502
DOI 10.30193/scidm-ds-79w9840

Citation


推薦資料集:


  • 桃園市無痛大腸鏡計畫醫療院所名單

    付費方式 免費
    更新頻率 不定期
    109年桃園市無痛性大腸鏡檢查補助計畫之合約院所名單
  • 15歲以上人口識字情形─按區域別性別分

    付費方式 免費
    更新頻率 不定期
    15歲以上人口識字情形─按區域別性別分(資料起始時間:86年)
  • 保護智慧財產權行動方案

    付費方式 免費
    更新頻率 不定期
    為因應國家發展需要,落實保護智慧財產權政策,行政院先後核定經濟部所提「推動保護智慧財產權行動年計畫」(民國91年)及「貫徹保護智慧財產權行動計畫」(民國92-94年、95-97年、98-100年、101-103年,自本期104-106年改為行動方案。由本局彙整各主、協辦機關按季填報列管追蹤表,以利追蹤管考本行動方案各項具體執行措施之執行情形。
  • 免繳就業安定費人數及資格分布

    付費方式 免費
    更新頻率 不定期
    可瞭解符合就業服務法第55條第3項規定免繳就業安定費之資格分布狀況