Sınıflandırma Algoritmalarının Mantığı Hakkında

bluesky

MB Üyesi
Kayıt
26 Haziran 2015
Mesajlar
7
Tepkiler
2
Merhaba,

Sınıflandırma algoritmaları ile ilgili genel bir sorum var. Aşağıda yazacağım iki durumdan hangisi daha yüksek doğruluk verir sizce? Fikirleriniz nedir? Sonuç sınıflandırma algoritmalarına göre değişir mi?

1) Büyük bir veri setim var. İçerisinde A B C D E classları içeriyor. Bununla bir model oluşturuyorum. Bu model'i train olarak alıp içerisinde A B ve C classları bulunan küçük bir veri setini de test ediyorum.

2) Büyük bir veri setim var. İçerisinde A B C classları içeriyor (D ve E yi çıkarıyorum). Bununla bir model oluşturuyorum. Bu model'i train olarak alıp içerisinde A B ve C classları bulunan küçük bir veri setini de test ediyorum.


Not: Random forest ile denediğimde 1) daha yüksek çıktı 2)'ye göre. Açıkçası ben 2)'nin performansının daha iyi olmasını bekliyordum. Bir anlam veremedim duruma.

Şimdiden teşekkür ederim :)
 
Yukarı Alt