需同意授權

TE_06_中文分詞語料庫_抽樣資料

使用條款

使用此資料集前,請詳閱下列條款:

  • 資料庫之電子型式,組成資料內容與型式,著作權屬中央研究院原各著做小組,智慧財產權所有權仍屬中研院所有。

  • 資料庫內容之著作權屬原始著作人所有

  • 牽涉本條款第一項及第二項著作內容之任何引用之商業行為應與著作權所有人另定約規定之。

  • 如有侵犯資料庫著作權或智慧財產權之行為,應由使用者自行負擔法律責任。

  • 如因使用資料庫而發生任何損害,原著作權人及授權單位(國網中心)不負任何損害賠償責任,使用人願意放棄向著作權人及授權單位索賠之權利。

  • 用戶如有因使用此資料而發表相關學術研究成果,須於文中載明。

  • 抽樣資料集開放公開使用,需先註冊並同意使用協議。

若使用者使用本資料集,即視為同意上述條款並履行相關法律義務。

中文分詞語料庫

中文分詞語料庫為一包含兩百萬詞、不含詞類標記的語料庫,每個文句皆根據分詞原則來斷 詞。而此分詞原則,乃是中華民國計算語言學學會在經濟部中央標準局委辦的「資訊處理用 中文分詞規範調查研究及草案研擬」計畫中所訂定的。本語料庫來源包括書面語和口語兩部 分,其中資訊類佔 21%。

其他補充說明(2022/9)

由於授權到期,故僅提供平台上的抽樣資料,已經不能再提供完整資料集。抽樣資料部份,目前僅需要申請 NCHC iServcie 帳號,並點選『同意授權』後即可下載。

若有購買或商業需求,可向中華民國計算語言學學會洽詢。

  • 窗口:黃琪
  • 學會電話:02-27883799*1502
  • 傳真:02-27881638
  • 電子信箱:aclclp@aclclp.org.tw

資料與資源

額外的資訊

欄位
最後更新 2022年9月14日, 凌晨5點58分 (UTC+00:00)
建立 2019年2月19日, 凌晨2點40分 (UTC+00:00)

推薦資料集:


  • 新竹市公務機關可供民眾飲用之飲水點資料

    付費方式 免費
    更新頻率 不定期
    新竹市飲水機飲水點位址
  • 公民營製造業、用水、電力及燃氣供應業污染防治支出

    付費方式 免費
    更新頻率 不定期
    公民營製造業、用水、電力及燃氣供應業污染防治支出含1.資本支出:新購買之污染防治設備、新購供污染防治設備使用之土地;2.經常支出為租用污染防治設備(含廠房)租金、污染防治設備操作維護費用、相關研究發展費用、委託民間處理費用;3.污染防治附帶收入。污染防治支出=資本支出+經常支出-污染防治附帶收入。
  • 臺中市賞花景點

    付費方式 免費
    更新頻率 不定期
    臺中市賞花景點
  • 病人用特殊營養食品許可資料集

    付費方式 免費
    更新頻率 不定期
    藉由本資料集可查詢經衛生福利部查驗登記核准之特定疾病配方食品之食品相關資訊。
  • 臺北市育嬰留職停薪勞工關懷措施執行情形

    付費方式 免費
    更新頻率 不定期
    臺北市育嬰留職停薪勞工關懷措施執行情形時間數列統計資料