Sınıflandırma Algoritmalarının Mantığı Hakkında

Konu, 'Genel Konular' kısmında bluesky tarafından paylaşıldı.

  1. bluesky

    bluesky MB Üyesi

    Kayıt:
    26 Haziran 2015
    Mesajlar:
    7
    Beğeniler:
    2
    En İyi Cevap:
    0
    Değerlendiriler:
    +3 / 0 / -0
    Merhaba,

    Sınıflandırma algoritmaları ile ilgili genel bir sorum var. Aşağıda yazacağım iki durumdan hangisi daha yüksek doğruluk verir sizce? Fikirleriniz nedir? Sonuç sınıflandırma algoritmalarına göre değişir mi?

    1) Büyük bir veri setim var. İçerisinde A B C D E classları içeriyor. Bununla bir model oluşturuyorum. Bu model'i train olarak alıp içerisinde A B ve C classları bulunan küçük bir veri setini de test ediyorum.

    2) Büyük bir veri setim var. İçerisinde A B C classları içeriyor (D ve E yi çıkarıyorum). Bununla bir model oluşturuyorum. Bu model'i train olarak alıp içerisinde A B ve C classları bulunan küçük bir veri setini de test ediyorum.


    Not: Random forest ile denediğimde 1) daha yüksek çıktı 2)'ye göre. Açıkçası ben 2)'nin performansının daha iyi olmasını bekliyordum. Bir anlam veremedim duruma.

    Şimdiden teşekkür ederim :)