需同意授權

20-newsgroups

The 20 Newsgroups data set

The 20 Newsgroups data set is a collection of approximately 20,000 newsgroup documents, partitioned (nearly) evenly across 20 different newsgroups. To the best of my knowledge, it was originally collected by Ken Lang, probably for his Newsweeder: Learning to filter netnews paper, though he does not explicitly mention this collection. The 20 newsgroups collection has become a popular data set for experiments in text applications of machine learning techniques, such as text classification and text clustering.

## Reference: * http://qwone.com/~jason/20Newsgroups/

資料與資源

額外的資訊

欄位
來源 http://qwone.com/~jason/20Newsgroups/
最後更新 十月 11, 2020, 12:13 (CST)
建立 三月 7, 2018, 16:43 (CST)

推薦資料集:


  • 經濟部中小企業處_前瞻特別預算會計報告

    付費方式 免費
    更新頻率 不定期
    經濟部中小企業處前瞻特別預算歲入(出)累計表、平衡表、資本資產表等。
  • 空氣品質小時值_高雄市_楠梓站

    付費方式 免費
    更新頻率 不定期
    高雄市-楠梓站小時值
  • 108年2月花蓮縣各項稅捐實徵淨額與預算數及上年同期比較-累計數

    付費方式 免費
    更新頻率 不定期
    108年花蓮縣各項稅捐實徵淨額與預算數及上年同期比較-累計數
  • 開發蛇紋石多元化工業材料之應用研究

    付費方式 免費
    更新頻率 不定期
    本計畫研究報告開放目的係以國內蛇紋石礦產應用研究情形產出資料,將傳統的礦產應用領域觀念轉型而成為精緻化及生活化產物,達到礦物資源零廢棄、高質化及高價化的目標,並作為日後業界相關研究之參考。
  • 商業登記(依營業項目別)-移民服務業

    付費方式 免費
    更新頻率 不定期
    提供全國移民服務業(JA04011)商業登記資料。