Algorytm wyszukiwania duplikatow.

Jest nastepujacy problem: Mamy liste wskaznikow na struktury, trzeba znalezc wszystkie struktury dla ktorych jedno z pol ma ta sama wartosc.

No i teraz pytanie jest o najszybszy algorytm do czegos takiego. Wymyslilem cos takiego zeby posortowac wszystkie stuktury wzgledem pola ktore nas interesuje a nastepnie przejrzec ta liste posortowanych i sprawdzac czy pole w strukturze n+1 jest takie samo jak w n.

Jakies inne pomysly?

W trakcie porównywania w sortowaniu odkładać do osobnej listy informację o duplikacie. Bez dodatkowego przechodzenia przez posortowaną listę.

Zależy też od tego co to za pole. Jeśli jest to coś większego to bez hashowania się nie obejdzie.

Koziołek napisał(a)

W trakcie porównywania w sortowaniu odkładać do osobnej listy informację o duplikacie. Bez dodatkowego przechodzenia przez posortowaną listę.

Może zrobić taki mechanizm że struktura posiada też wskaźnik na własny typ i po znalezieniu duplikatu wskaźnik na niego byłby usuwany z listy sortowanej i ustawiany w strukturze której duplikat znaleziono lub ostatnim duplikacie tej struktury. Wtedy każda struktura od razu posiadałaby 'listę' swoich duplikatów. Oszczędziłoby to nieco mapowania.

Istnieją dwa sensowne rozwiązania tego problemu:

Sortowanie+usuwanie duplikatów - opisane w pierwszym poście
Wstawienie wszystkiego do hashowanego zbioru bez duplikatów (w Javie - HashSet, trzeba jednak zaimplementować metodę hashCode())

Dla dużego zbioru i dobrej funkcji hashującej 2. będzie szybsze.

Liczba odpowiedzi na stronę

Algorytm wyszukiwania duplikatow.

Koziołek napisał(a)

1 użytkowników online, w tym zalogowanych: 0, gości: 1

Praca dla programistów

Forum dyskusyjne

Sprawy administracyjne

O nas

Skontaktuj się z nami