20-newsgroups

The 20 Newsgroups data set

The 20 Newsgroups data set is a collection of approximately 20,000 newsgroup documents, partitioned (nearly) evenly across 20 different newsgroups. To the best of my knowledge, it was originally collected by Ken Lang, probably for his Newsweeder: Learning to filter netnews paper, though he does not explicitly mention this collection. The 20 newsgroups collection has become a popular data set for experiments in text applications of machine learning techniques, such as text classification and text clustering.

## Reference: * http://qwone.com/~jason/20Newsgroups/

資料與資源

額外的資訊

欄位
來源 http://qwone.com/~jason/20Newsgroups/
最後更新 一月 9, 2020, 09:02 (CST)
建立 三月 7, 2018, 16:43 (CST)

推薦資料集:


  • 新北市104年土地徵收統計表

    付費方式 免費
    更新頻率 不定期
    104年度新北市土地徵收筆數、面積及補償費統計資料
  • 最近二年產險強制汽車保險賠款率統計— (曆年制)—按公司

    付費方式 免費
    更新頻率 不定期
    最近二年產險強制汽車保險賠款率統計— (曆年制)—按公司(保發中心)
  • 一般天氣預報-屏東縣天氣小幫手

    付費方式 免費
    更新頻率 不定期
    臺灣各縣市天氣預報資料及國際都市天氣預報
  • 新竹縣公共哺集乳室

    付費方式 免費
    更新頻率 不定期
    新竹縣公共哺集乳室資訊
  • 1732-04-02-2 臺中市少年(兒童)犯罪狀況

    付費方式 免費
    更新頻率 不定期
    臺中市少年(兒童)犯罪狀況