需同意授權

20-newsgroups

The 20 Newsgroups data set

The 20 Newsgroups data set is a collection of approximately 20,000 newsgroup documents, partitioned (nearly) evenly across 20 different newsgroups. To the best of my knowledge, it was originally collected by Ken Lang, probably for his Newsweeder: Learning to filter netnews paper, though he does not explicitly mention this collection. The 20 newsgroups collection has become a popular data set for experiments in text applications of machine learning techniques, such as text classification and text clustering.

## Reference: * http://qwone.com/~jason/20Newsgroups/

資料與資源

額外的資訊

欄位
來源 http://qwone.com/~jason/20Newsgroups/
最後更新 2020年10月11日, 凌晨4點13分 (UTC+00:00)
建立 2018年3月7日, 早上8點43分 (UTC+00:00)

推薦資料集:


  • 臺南市戒菸合約醫事機構

    付費方式 免費
    更新頻率 不定期
    本資料集為臺南市戒菸合約醫事機構名單
  • 109年7月花蓮縣土地增值稅徵收

    付費方式 免費
    更新頻率 不定期
    109年花蓮縣土地增值稅徵收
  • 臺北市政府消防局受理各類案件統計表

    付費方式 免費
    更新頻率 不定期
    提供臺北市政府消防局受理各類型案件數量
  • 我國薪資成長與所得分配分析及對策

    付費方式 免費
    更新頻率 不定期
    因應社會關注薪資成長及所得差距議題,爰針對相關趨勢及因應對策進行分析,俾提供各界參考運用,資料內容包含前言、薪資變動趨勢與原因分析、所得分配變動趨勢與原因分析、因應對策、結語。
  • 新竹縣房屋地段等級標準表

    付費方式 免費
    更新頻率 不定期
    新竹縣房屋地段等級標準表