Zmniejszenie liczby kategorii w tabelce

1

Jak mogę w R zmniejszyć liczbę kategorii?

Bo wyszukałem taka funkcje, która pokazuje mi kolumnę która ma więcej niż 53

which(sapply(Beijing, function(Beijing) nlevels(Beijing) > 53))

a muszę wykorzystać randomForest, a nie koniecznie chcę kasować dodatkowo kolumnę.

forest.Beijing<- randomForest(cbwd~., data=Beijing, ntree=50, do.trace=20)

Bo ogólnie mam taki błąd

Error in randomForest.default(m, y, ...) : 
  Can not handle categorical predictors with more than 53 categories.
0

Rozumiem, że to problem klasyfikacyjny. Co klasyfikujesz? Od tego zależy jaką metodę możesz użyć do pobandowania przedziałów Twojego factora, tak by mieć mnie leveli niż te 52.

a jak chcesz wyrzucić kolumnę x z formuły to możesz napisać y ~ . -x

0

już sobie ogarnołem

1 użytkowników online, w tym zalogowanych: 0, gości: 1