Need authorization agreement

20-newsgroups

The 20 Newsgroups data set

The 20 Newsgroups data set is a collection of approximately 20,000 newsgroup documents, partitioned (nearly) evenly across 20 different newsgroups. To the best of my knowledge, it was originally collected by Ken Lang, probably for his Newsweeder: Learning to filter netnews paper, though he does not explicitly mention this collection. The 20 newsgroups collection has become a popular data set for experiments in text applications of machine learning techniques, such as text classification and text clustering.

## Reference: * http://qwone.com/~jason/20Newsgroups/

データとリソース

追加情報

フィールド
ソース http://qwone.com/~jason/20Newsgroups/
最終更新 10月 11, 2020, 12:13 (CST)
作成日 3月 7, 2018, 16:43 (CST)

推薦資料集:


  • 公司解散、撤銷及廢止資本額-按縣市分

    Payment instrument Free
    Update frequency Irregular
    本資料庫儲存全國公司登記基本資料。
  • 花蓮縣土石採取景觀維護特別稅107年度7月份徵績表

    Payment instrument Free
    Update frequency Irregular
    花蓮縣土石採取景觀維護特別稅徵績表
  • 全國企業部門研發經費_依OECD行業別區分統計資料

    Payment instrument Free
    Update frequency Irregular
    為便於瞭解及掌握我國科技研究發展狀況,進而建立科技指標,並與他國作客觀比較作為國家制定科技發展政策之參考,科技部每年定期辦理「全國研發狀況調查」。本資料集為「全國研發狀況調查」之統計結果之一。 2.“..”係指無數值。 3.“0”係指不及一單位。
  • 臺灣地區土地增值稅土地移轉現值級距件數統計表

    Payment instrument Free
    Update frequency Irregular
    臺灣地區土地增值稅土地移轉現值級距件數統計表
  • 台灣自來水公司工項名稱及編碼

    Payment instrument Free
    Update frequency Irregular
    提供本公司供料分析之各工項名稱及編碼