需同意授權

20-newsgroups

The 20 Newsgroups data set

The 20 Newsgroups data set is a collection of approximately 20,000 newsgroup documents, partitioned (nearly) evenly across 20 different newsgroups. To the best of my knowledge, it was originally collected by Ken Lang, probably for his Newsweeder: Learning to filter netnews paper, though he does not explicitly mention this collection. The 20 newsgroups collection has become a popular data set for experiments in text applications of machine learning techniques, such as text classification and text clustering.

## Reference: * http://qwone.com/~jason/20Newsgroups/

資料與資源

額外的資訊

欄位
來源 http://qwone.com/~jason/20Newsgroups/
最後更新 十月 11, 2020, 12:13 (CST)
建立 三月 7, 2018, 16:43 (CST)

推薦資料集:


  • 寺廟登記概況─按區域別、宗教別分

    付費方式 免費
    更新頻率 不定期
    寺廟登記概況─按區域別、宗教別分(資料起始時間:85年)
  • 非傳統商標統計表

    付費方式 免費
    更新頻率 不定期
    彙整每月份非傳統性商標申請之統計資料,供外界參考利用。
  • 高雄市110年楠梓分局防空避難場所

    付費方式 免費
    更新頻率 不定期
    110年高雄市楠梓分局防空避難地點場所
  • 桃園市立案工會名冊

    付費方式 免費
    更新頻率 不定期
    桃園市立案工會名冊
  • 用過核子燃料貯存設施興建、運轉與除役審查費及檢查費

    付費方式 免費
    更新頻率 不定期
    用過核子燃料貯存設施興建、運轉與除役審查費及檢查費