Czesc, zastnawiam sie nad najlepszym klasyfikatorem dla bazy z duza iloscia danych. Scislej mowiac chodzi mi o taki, ktory porownywalby dane z klikunastu tabel (w kazdej z tych tabel kolumny, ktore mialyby byc porownane moga roznic sie nazwa) i sprawdzal czy dane nalezace do kolumny w jednej tabeli odpowiadaja (lub sa podobne) danym z kolumny tabeli drugiej. Niektore pola moga miec brakujace dane. Wiem prawie na pewno, ze Naiwny Bayes sie nie sprawdzi (brak okreslonych prawdopodobienstw). Z gory przepraszam za brak polskich znakow i dziekuje za wszystkie pomysly/podpowiedzi.