需同意授權

20-newsgroups

The 20 Newsgroups data set

The 20 Newsgroups data set is a collection of approximately 20,000 newsgroup documents, partitioned (nearly) evenly across 20 different newsgroups. To the best of my knowledge, it was originally collected by Ken Lang, probably for his Newsweeder: Learning to filter netnews paper, though he does not explicitly mention this collection. The 20 newsgroups collection has become a popular data set for experiments in text applications of machine learning techniques, such as text classification and text clustering.

## Reference: * http://qwone.com/~jason/20Newsgroups/

資料與資源

額外的資訊

欄位
來源 http://qwone.com/~jason/20Newsgroups/
最後更新 十月 11, 2020, 12:13 (CST)
建立 三月 7, 2018, 16:43 (CST)

推薦資料集:


  • 澎湖縣政府農漁局107年度『澎湖優鮮』標章推廣講習課程人數統計表

    付費方式 免費
    更新頻率 不定期
    『澎湖優鮮』標章推廣講習課程人數
  • 各國證券市場成交值週轉率比較_NEW

    付費方式 免費
    更新頻率 不定期
    各國證券市場成交值週轉率比較
  • 109年臺東縣國民小學學校

    付費方式 免費
    更新頻率 不定期
    109年度臺東縣智慧福利服務躍升計畫OpenData資料收集
  • 歲入累計表

    付費方式 免費
    更新頻率 不定期
    本會104年度10月份歲入累計表,已同步登載於https://data.gov.tw/dataset/20840
  • 境外基金機構基本資料

    付費方式 免費
    更新頻率 不定期
    境外基金機構基本資料(投信、投顧、券商、銀行)(臺灣集中保管結算所)