Need authorization agreement

20-newsgroups

The 20 Newsgroups data set

The 20 Newsgroups data set is a collection of approximately 20,000 newsgroup documents, partitioned (nearly) evenly across 20 different newsgroups. To the best of my knowledge, it was originally collected by Ken Lang, probably for his Newsweeder: Learning to filter netnews paper, though he does not explicitly mention this collection. The 20 newsgroups collection has become a popular data set for experiments in text applications of machine learning techniques, such as text classification and text clustering.

## Reference: * http://qwone.com/~jason/20Newsgroups/

データとリソース

追加情報

フィールド
ソース http://qwone.com/~jason/20Newsgroups/
最終更新 10月 11, 2020, 12:13 (CST)
作成日 3月 7, 2018, 16:43 (CST)

推薦資料集:


  • 臺南市管區域排水與集水區圖資

    Payment instrument Free
    Update frequency Irregular
    本資料集提供市管區域排水資訊。 1.臺南市區域排水圖資 提供本市轄內區域排水(包含市管公告區排),其圖資民眾供參考下載使用,如有錯誤依核定規劃報告為主。 2.區域排水系統集水區 提供本市轄內區域排水系統集水區範圍,其圖資民眾供參考下載使用,如有錯誤依核定規劃報告為主。
  • 110年6月花蓮縣礦石開採景觀維護特別稅徵績表

    Payment instrument Free
    Update frequency Irregular
    花蓮縣礦石開採景觀維護特別稅徵績表
  • 空氣品質小時值_臺北市_中山站

    Payment instrument Free
    Update frequency Irregular
    臺北市-中山站小時值
  • 公眾頻率分配

    Payment instrument Free
    Update frequency Irregular
    行動通信業務頻率分配
  • 環境教育終身學習護照註冊人數

    Payment instrument Free
    Update frequency Irregular
    環境教育終身學習網所有的註冊人數(含未開通)