Algorytm kNN

0

Cześć :) natrafiłem na pewien problem w kNN i nie bardzo wiem jak w takiej sytuacji algorytm powinien się zachować. Polecenie zadania narzuca mi wybranie odległości euklidesowej i k=5

screenshot-20191023165853.png

Mając takie dane muszę zakwalifikować obiekt z samego dołu (3,3,1,2). W kolumnie F mam policzone odległości. Problem w tym że najniższe odległości to 0 o liczebności 1 i 1 o liczebności 6. Mam więc wybrać obiekt o odległości 0 i 4 losowe/o najniższym indeksie obiekty odległe o 1, czy zignorować k=5 i wybrać wszystkie elementy odległe o 1?

2

To jest problem otwarty i obie zaproponowane przez Ciebie opcje są dopuszczalne. Zauważ, że jeśli dopuścisz wszystkie równoodległe punkty to ostatecznie możesz dostać ich parzystą liczbę i jeśli później używasz głosowania do wyznaczenia klasy, to możesz znowu otrzymać remis. W przypadku losowania decyzje modelu będą niedeterministyczne, co też może być problemem. Tutaj masz dosyć dobrze podsumowane opcje i ich konsekwencje.

Osobiście gdyby takie przypadki remisów zdarzały się często to może to być wskazówka, żeby użyć innej metryki/modelu.

1 użytkowników online, w tym zalogowanych: 0, gości: 1