TTC-3600: Benchmark dataset for Turkish text categorization

The TTC-3600 data set is a collection of Turkish news and articles including categorized 3,600 documents from 6 well-known portals in Turkey. It has 4 different forms in ARFF Weka format.

資料與資源

額外的資訊

欄位
作者 MCI Machine Learning Repository
最後更新 八月 18, 2019, 17:21 (CST)
建立 九月 7, 2018, 10:23 (CST)
Area "Computer"
Associated Tasks "Classification
Attribute Characteristics "Integer"
Data Set Characteristics "Text"
Date Donated "2017-02-08"
Missing Values "N/A"
Number of Instances "3600"
Number of Web Hits "5755"
Number_of_Attributes "4814"

推薦資料集:


  • 地區年齡性別統計表-水痘併發症(以週為單位)

    付費方式 免費
    更新頻率 不定期
    2003年起各地區、各年齡層、性別之病例數統計表(疾病名稱:水痘併發症,日期種類:發病日,病例種類:確定病例,感染來源:本土、境外移入)
  • 臺北市政府政風處公開性別統計指標

    付費方式 免費
    更新頻率 不定期
    依本府強化性別統計體系推動計畫及本府暨各機關構落實性別主流化暨推展性別平等工作總計畫按年更新及檢討本處性別統計指標
  • 危險物品(說明文件)

    付費方式 免費
    更新頻率 不定期
    中華郵政公司郵務業務相關資訊
  • 屏東縣政府暨所屬機關規費徵收項目及依據

    付費方式 免費
    更新頻率 不定期
    屏東縣政府規費徵收資料
  • 遭受災害救助情形

    付費方式 免費
    更新頻率 不定期
    1.遭受災害救助情形 2.單位:次、所、人、戶、新臺幣千元 3.各項欄位說明詳參新北市統計年報(網址:http://www.bas.ntpc.gov.tw/home.jsp?id=OTE=)或電洽主計處查詢。