Algorytm analizy danych

0

Witam. Szukam algorytmu analizy danych. Mam zbiór uczący nie pogrupowany (nie poklasyfikowany) i mam nową obserwację i chciałbym znaleźć w zbiorze uczącym obserwację jak najbardziej podobną do tej nowej.

Proszę o pomoc w znalezieniu odpowiedniego algorytmu, metody. Mile widziany 4ql SAS.

Z góry dziękuję za pomoc.

0

Ja nic nie zrozumiałem z tego co napisałęś, może tylko, ze jest jakiś zbiór uczący, chodzi ci o sieci neuronowe czy coś?

Możesz powiedzieć co masz i co chcesz osiągnąć? i czym jest obserwacja dla ciebie?

0

W twoim przypadku najprostsze podejście to wprowadzenie odpowiedniej metryki (nie chcę z góry pisać jakiej, dużo zależy od danych) i sprawdzenie, która obserwacja ze zbioru uczącego znajduje się najbliżej nowej obserwacji.

0

Prościej może będzie tak. Załóżmy że mam zbiór 100 zdjęć (np. twarzy) i mam nowe zdjęcie i chciałbym w zbiorze tych 100 zdjęć wyszukać najbardziej podobne.

0
Crude Monte Carlo napisał(a):

W twoim przypadku najprostsze podejście to wprowadzenie odpowiedniej metryki (nie chcę z góry pisać jakiej, dużo zależy od danych) i sprawdzenie, która obserwacja ze zbioru uczącego znajduje się najbliżej nowej obserwacji.

może wymień parę metod

0
Antoni.olesz napisał(a):

może wymień parę metod

Nie potrzebujesz, jakiś specjalnych metod, bo to co robisz to nie klasteryzacja, tylko sprawdzanie podobieństwa nowego elementu, do wszystkich pozostałych. Rozumiem, że masz już potworzone cechy?
Jeżeli zdjęć jest dużo to możesz zastanowić się nad np użyciem k-medoidów, wówczas zamiast sprawdzać odległość do wszystkich m (załóżmy 99) obserwacji. to sprawdzasz odległość do medoidów (k sprawdzeń) i następnie w klastrze do najbliższego elementu (~n /k sprawdzeń) Czyli np dla k = 5 (optymalne musisz określić) mamy około 5 + 20 sprawdzeń.

EDIT: tutaj masz trochę trudniejsze ale mniej naiwne propozycję https://en.wikipedia.org/wiki/Similarity_learning

0

Jak twoje twarze są dobrze wykrywane i są w ten sam sposób zaprezentowane co nowego, to tylko spojrzysz na największy możliwy procent dokładności przy pierwszym wyszukaniu, gdy sieci są już wyćwiczone, to dostaniesz procent dokładności i on będzie najlepszy porównaniem tej sieci wyuczonej.

0
Crude Monte Carlo napisał(a):
Antoni.olesz napisał(a):

może wymień parę metod

Nie potrzebujesz, jakiś specjalnych metod, bo to co robisz to nie klasteryzacja, tylko sprawdzanie podobieństwa nowego elementu, do wszystkich pozostałych. Rozumiem, że masz już potworzone cechy?
Jeżeli zdjęć jest dużo to możesz zastanowić się nad np użyciem k-medoidów, wówczas zamiast sprawdzać odległość do wszystkich m (załóżmy 99) obserwacji. to sprawdzasz odległość do medoidów (k sprawdzeń) i następnie w klastrze do najbliższego elementu (~n /k sprawdzeń) Czyli np dla k = 5 (optymalne musisz określić) mamy około 5 + 20 sprawdzeń.

Pracuję teraz nad metodą k-średnich myślałem też na sieciami neuronowymi ale zazwyczaj to co robiłem z sieciami to wektor wchodzący i ocena np. klasyfikacja liter alfabetu wektor wchodzący to piksele z obraza i moja ocena czyli np. litera A. Jak to zrobić w tym przypadku kiedy nie mamy takiej oceny tylko np 100 zdjęć porównujemy z tym jednym. Ciekawy problem!!

1 użytkowników online, w tym zalogowanych: 0, gości: 1