Need authorization agreement

TE_03_漢語平衡語料庫_抽樣資料

使用條款

使用此資料集前,請詳閱下列條款:

  • 資料庫之電子型式,組成資料內容與型式,著作權屬中央研究院原各著做小組,智慧財產權所有權仍屬中研院所有。

  • 資料庫內容之著作權屬原始著作人所有

  • 牽涉本條款第一項及第二項著作內容之任何引用之商業行為應與著作權所有人另定約規定之。

  • 如有侵犯資料庫著作權或智慧財產權之行為,應由使用者自行負擔法律責任。

  • 如因使用資料庫而發生任何損害,原著作權人及授權單位(國網中心)不負任何損害賠償責任,使用人願意放棄向著作權人及授權單位索賠之權利。

  • 用戶如有因使用此資料而發表相關學術研究成果,須於文中載明。

  • 抽樣資料集開放公開使用,需先註冊並同意使用協議。

若使用者使用本資料集,即視為同意上述條款並履行相關法律義務。

中央研究院漢語平衡語料庫 簡介

中央研究院漢語平衡語料庫(簡稱 Sinica Corpus)第 4.0 版,為一包含一千多萬目詞的帶標記平衡語料庫。本語料庫中每個文句都依詞斷開,並標示詞類標記。語料的蒐集也盡量做到平衡分配在不同的主題和語式上,是現代漢語無窮多的語句中一個代表性的樣本。所蒐集的文章為 1981 年到 2007 年之間的文章。

其他補充說明(2022/9)

由於授權到期,故僅提供平台上的抽樣資料,已經不能再提供完整資料集。抽樣資料部份,目前僅需要申請 NCHC iServcie 帳號,並點選『同意授權』後即可下載。

若有購買或商業需求,可向中華民國計算語言學學會洽詢。

  • 窗口:黃琪
  • 學會電話:02-27883799*1502
  • 傳真:02-27881638
  • 電子信箱:aclclp@aclclp.org.tw

Data and Resources

Additional Info

Field Value
Author sinicaedutw
Last Updated September 30, 2025, 09:28 (CST)
Created February 19, 2019, 10:35 (CST)
DOI 10.30193/scidm-ds-d4q9d1c

Citation


推薦資料集:


  • 104年度宜蘭縣政府財政稅務局歲出機關別決算表

    Payment instrument Free
    Update frequency Irregular
    宜蘭縣政府財政稅務局歲出機關別決算表
  • 高雄市水量水質自動監測連線傳輸監測紀錄值即時資料集

    Payment instrument Free
    Update frequency Irregular
    系統將回應最新監測數據之XML(最新一小時)
  • 工程會列管公共建設計畫各主辦機關年度預算執行情形統計表

    Payment instrument Free
    Update frequency Irregular
    提供當年度工程會列管公共建設計畫各主辦機關年度預算執行情形統計資料。
  • 水情監測歷史影像資料集 - 2019 荷包嶼站鏡頭

    Payment instrument Free
    Update frequency Irregular
    本資料集彙整監測站 - 荷包嶼站鏡頭,2019年度每日歷史影像檔(.jpg)封裝之壓縮檔。檔名說明: 年度_月_日_測站名稱.zip 全台目前現有監測影像共有1089組監視影像歷史紀錄,監測重要河川、橋梁、堰壩等水利設施,以及易淹水地區,並全年不間斷監測並儲存資料。
  • 臺南市締盟城市一覽表

    Payment instrument Free
    Update frequency Irregular
    城市名稱、國別、簽約日期、我方簽約代表、對方簽約代表、城市官方網站、經緯度