TTC-3600: Benchmark dataset for Turkish text categorization

The TTC-3600 data set is a collection of Turkish news and articles including categorized 3,600 documents from 6 well-known portals in Turkey. It has 4 different forms in ARFF Weka format.

資料與資源

額外的資訊

欄位
作者 MCI Machine Learning Repository
最後更新 八月 18, 2019, 17:21 (CST)
建立 九月 7, 2018, 10:23 (CST)
Area "Computer"
Associated Tasks "Classification
Attribute Characteristics "Integer"
Data Set Characteristics "Text"
Date Donated "2017-02-08"
Missing Values "N/A"
Number of Instances "3600"
Number of Web Hits "5755"
Number_of_Attributes "4814"

推薦資料集:


  • 高雄市茄萣區109年公告地價

    付費方式 免費
    更新頻率 不定期
    高雄市茄萣區109年公告地價
  • 中港園區動產擔保交易資料

    付費方式 免費
    更新頻率 不定期
    提供中港園區動產擔保交易之資料
  • 跨醫院門診同藥理用藥日數重疊率-降血壓 (口服)(醫院總額指標)

    付費方式 免費
    更新頻率 不定期
    資料來源:保險醫事服務機構醫療服務點數申報資料 分子:同一位病人在各院所的不同處方,開立同一種藥理分類之「口服降血壓藥物」,重複給藥日份加總。 分母:開立「口服降血壓藥物」案件的給藥日份加總。 計算公式:(分子/分母)x 100%
  • 臺中市106年9月份十大易肇事路段(口)

    付費方式 免費
    更新頻率 不定期
    臺中市106年9月份十大易肇事路段(口)
  • 廢食用油流向清運資料統計(屬事業廢棄物部分)

    付費方式 免費
    更新頻率 不定期
    全國事業機構(以縣市區分)申報廢食用油之申報量。