TTC-3600: Benchmark dataset for Turkish text categorization

The TTC-3600 data set is a collection of Turkish news and articles including categorized 3,600 documents from 6 well-known portals in Turkey. It has 4 different forms in ARFF Weka format.

資料與資源

額外的資訊

欄位
作者 MCI Machine Learning Repository
最後更新 八月 18, 2019, 17:21 (CST)
建立 九月 7, 2018, 10:23 (CST)
Area "Computer"
Associated Tasks "Classification
Attribute Characteristics "Integer"
Data Set Characteristics "Text"
Date Donated "2017-02-08"
Missing Values "N/A"
Number of Instances "3600"
Number of Web Hits "5755"
Number_of_Attributes "4814"

推薦資料集:


  • 國網洞見資料集_文化與信仰_2

    付費方式 免費
    更新頻率 不定期
    關鍵字: mb,竊盜,音樂家,海事,舞蹈,原理,礦物,糖業,維護,得分配,等等
  • 村村或部落(鄰)有寬頻上網-年度計畫經費

    付費方式 免費
    更新頻率 不定期
    村村或部落(鄰)有寬頻上網-年度計畫經費
  • 公寓大廈管理組織報備清冊-三重區

    付費方式 免費
    更新頻率 不定期
    公寓大廈管理組織報備清冊-三重區
  • 行政院原住民族委員會文化管理局104年7月份會計月報

    付費方式 免費
    更新頻率 不定期
    行政院原住民族委員會文化管理局104年7月份會計月報
  • 各縣市高爾夫球場面積及數量

    付費方式 免費
    更新頻率 不定期
    各縣市高爾夫球場面積及數量