TTC-3600: Benchmark dataset for Turkish text categorization

The TTC-3600 data set is a collection of Turkish news and articles including categorized 3,600 documents from 6 well-known portals in Turkey. It has 4 different forms in ARFF Weka format.

資料與資源

額外的資訊

欄位
作者 MCI Machine Learning Repository
最後更新 八月 18, 2019, 17:21 (CST)
建立 九月 7, 2018, 10:23 (CST)
Area "Computer"
Associated Tasks "Classification
Attribute Characteristics "Integer"
Data Set Characteristics "Text"
Date Donated "2017-02-08"
Missing Values "N/A"
Number of Instances "3600"
Number of Web Hits "5755"
Number_of_Attributes "4814"

推薦資料集:


  • 108年臺中市燃氣熱水器承裝業及其技術士清冊

    付費方式 免費
    更新頻率 不定期
    108年臺中市列管之燃氣熱水器承裝業及其技術士清冊
  • 108年度宜蘭縣身心障礙住宿機構

    付費方式 免費
    更新頻率 不定期
    108年度宜蘭縣社福相關資料
  • 標準檢驗局會計月報

    付費方式 免費
    更新頻率 不定期
    按月提供經濟部標準檢驗局及所屬會計月報資料
  • 20903-01-16-2 臺中市印花稅查徵統計-以前年度

    付費方式 免費
    更新頻率 不定期
    臺中市印花稅查徵統計-以前年度
  • AIOT_TEAM2

    付費方式 免費
    更新頻率 不定期