需同意授權

20-newsgroups

The 20 Newsgroups data set

The 20 Newsgroups data set is a collection of approximately 20,000 newsgroup documents, partitioned (nearly) evenly across 20 different newsgroups. To the best of my knowledge, it was originally collected by Ken Lang, probably for his Newsweeder: Learning to filter netnews paper, though he does not explicitly mention this collection. The 20 newsgroups collection has become a popular data set for experiments in text applications of machine learning techniques, such as text classification and text clustering.

## Reference: * http://qwone.com/~jason/20Newsgroups/

資料與資源

額外的資訊

欄位
來源 http://qwone.com/~jason/20Newsgroups/
最後更新 十月 11, 2020, 12:13 (CST)
建立 三月 7, 2018, 16:43 (CST)

推薦資料集:


  • 台灣自來水公司用戶水質資訊公開

    付費方式 免費
    更新頻率 不定期
    提供民眾查詢各縣市鄉鎮水質硬度
  • 衛生福利部全民健康保險會委員會議議事錄

    付費方式 免費
    更新頻率 不定期
    依據全民健康保險會組成及議事辦法第12條,本會委員會議應依發言作成會議實錄,載明下列事項(如次項欄位:主要欄位說明),於會議後十日內公開,本會爰公開於衛生福利部網站本會網頁。
  • 土地重劃工程處農村社區土地重劃資訊滿意度調查

    付費方式 免費
    更新頻率 不定期
    農村社區土地重劃資訊滿意度調查
  • 基隆關海運快遞業者名冊

    付費方式 免費
    更新頻率 不定期
    提供基隆關海運快遞業者名冊
  • 一般優質企業名冊

    付費方式 免費
    更新頻率 不定期
    提供一般優質企業名冊