Algorytm SIFT do rozpoznawania wzorców

0

Hey,
wcześniej było już kilka tematów poświęconych SSN i rozpoznawaniu obrazów jednak ostatnio przeczytałem o algorytmie SIFT, który podobno jest bardziej skuteczny jeśli chodzi rozpoznawanie wzorców. Szukałem trochę w google ale nie znalazłem nic specjalnego jeśli chodzi o opis tego algorytmu więc chciałem poprosić was o pomoc - może wy coś macie lub znaleźliście? Może znacie jakąś książkę, gdzie byłby on dobrze wyjaśniony.
Zależy mi na jakimś dobrym opracowaniu, gdzie będzie wyjaśnione krok po kroku o co w nim chodzi (wszystkie zmienne i działania będą opisane) i dobrze byłoby, gdyby to było w j. polskim :)
Najlepiej byłoby, gdyby to była książka, którą mógłbym wypożyczyć lub nabyć.

A tych, którzy mieli z nim do czynienia chciałem się zapytać co o nim sądzicie? czy w porównaniu z SSN jest sens się za niego brać? chodzi mi np. o rozpoznawanie znaków, tablic rej. liter etc. A może znacie jeszcze jakieś ciekawe algorytmy, którymi warto się zainteresować?

Pozdrawiam i z góry dzięki za wszelką pomoc

0

To wdzięczny temat-kiedyś się zajmowałem przetwarzaniem obrazu i powiem CI, że nie masz co liczyć na materiały książkowe a już tym bardziej po polsku...zapomnij o tym.
Zasada jest taka, ze poszukujesz na IEEE jakiegoś pdfa i go po prostu przerabiasz. Nie wiem czy masz podstawy teoretyczne o przetwarzaniu...zacznij od tego. Zainteresuj się co robi z obrazem np. DoG który jest wykorzystywany w SIFT.
Jeżeli chodzi o strikte rozpoznawanie obrazu zacznij od Hough transform, potem jej odmiany-udoskonalenia....a potem ściagnij sobie pdfa którego łatwo znaleźc autora algorytmu SIFT:

"Object Recognition from Local Scale-Invariant Features" David G. Lowe

I po prostu czytasz i piszesz kod i tyle.

Poza tym nie ma "złotej" zasady wykrywania czegoś w obrazie. po prostu jest to zlepek różnych sposobów podjeścia do przetwarzania obrazów - łączysz np. kwantyzację,klasteryzację, coś tam z przepływem optycznym, moze jakieś nieregularne piramidy i otrzymujesz jakiś wynik. Żeby brac sie za SIFT albo inny "uniwersalny" algorytm musisz te zagadnienia mieć przerobione i sam już mieć pełno kodów źródłowych napisanych na podstawie małych wycinków treści różnych metod przetwarzania obrazu.

Nie licz na to, że ktoś krok po kroku powie Ci: pod a podstaw 15 pod b ilośc pikseli, wymnóż i masz obiekt. Raczej spotkasz się ze zdaniami: "człon w*O symbolizuje iloczyn wagi z jaką wartośc przepływu optycznego jest brana pod uwagę do sumy opisujacej zmianę bloku". A to jak Ty ten przepływ wyliczysz to Twoja brożka - są tuziny algorytmów i sam musisz to zaimplementowac.

Powodzenia

1 użytkowników online, w tym zalogowanych: 0, gości: 1