需同意授權

20-newsgroups

The 20 Newsgroups data set

The 20 Newsgroups data set is a collection of approximately 20,000 newsgroup documents, partitioned (nearly) evenly across 20 different newsgroups. To the best of my knowledge, it was originally collected by Ken Lang, probably for his Newsweeder: Learning to filter netnews paper, though he does not explicitly mention this collection. The 20 newsgroups collection has become a popular data set for experiments in text applications of machine learning techniques, such as text classification and text clustering.

## Reference: * http://qwone.com/~jason/20Newsgroups/

資料與資源

額外的資訊

欄位
來源 http://qwone.com/~jason/20Newsgroups/
最後更新 十月 11, 2020, 12:13 (CST)
建立 三月 7, 2018, 16:43 (CST)

推薦資料集:


  • 公平交易委員會員額按職位與性別統計

    付費方式 免費
    更新頻率 不定期
    公平交易委員會員額按職位與性別統計(自民國101年起,以當年度12月為基準之統計)
  • 綜合所得稅基本所得額平均每件所得金額各縣市申報統計表

    付費方式 免費
    更新頻率 不定期
    綜合所得稅基本所得額平均每件所得金額各縣市申報統計表 單位:金額(千元)
  • 高雄市漁港別漁產量及漁船筏數

    付費方式 免費
    更新頻率 不定期
    高雄市漁港別漁產量及漁船筏數資訊
  • 投資台灣入口網電子報歷史資料

    付費方式 免費
    更新頻率 不定期
    每月發行之電子報內容
  • 板橋榮民之家處公務電話一覽表

    付費方式 免費
    更新頻率 不定期
    本資料集主要提供板橋榮民之家各項服務業務承辦聯絡資料