Eksploracja baz danych

0

Witam,

Mam pytanie czy ktoś z was zajmuję się może data mining? Wiadomo że pewne dane może wyciągnąć stosując zapytania SQL ale ja mam na myśli bardziej zaawansowane metody z wykorzystaniem algorytmów wyszukiwania. Temat staje się coraz bardziej popularny i nawet słyszałem od pewnego człowieka że jedna z galerii handlowych w Lublinie stosuję właśnie data mining.
Przeszukując hurtownie i bazy danych może odkrywać bardzo ciekawe zależności. np. Pewna francuska organizacja odkryła że najbardziej wiarygodni pod względem możliwości wywiązania się kredytów na auto są właściciele czerwonych samochodów...

Data mining umoliwia formułowanie zapytan na znacznie wyższym poziomie abstrakcji
anieżli pozwala na to standard SQL.

Zapytania w (data mining)maja charakter znacznie bardziej ogólny
i znacznie bardziej abstrakcyjny:

Jakie inne jeszcze produkty, najczesciej, kupuja klienci,
którzy kupuja wino?
Czym rónia sie koszyki klientów kupujacych wino i piwo?
W jaki sposób mona scharakteryzowac klientów
kupujacych wino?
W jaki sposób mona scharakteryzowac klientów
kupujacych wino?
Czy mona dokonac predykcji,że dany klient kupi wino?
Czy istnieje korelacja pomiedzy lokalizacja oddziału supermarketu a asortymentem
produktów, których sprzeda jest wysza od sredniej sprzeday produktów?

0

Można połączyć produkty, ich cenę aby ustalić kto zbuduje bombę , kto ile zarabia, czy jego wydatki nie przekraczają deklarowanych dochodów czy w tym samym czasie dwie poszukiwane osoby nie były w tym samym miejscu.
Algorytmy potrafią połączyć tak stare i tak nikłe informacje ze trzeba by codziennie nowy telefon kupować aby system zmylić.
Wszystko co wysyłamy prze internet (nawet to co piszemy) i to co wysyłamy przez smsy można analizować.
analizuje się tembr głosu anie tylko tres i można odróżnić kłamstwo ,z art od prawdy.
To oprogramowanie antyterrorystyczne - nazywa się Echelon:

Te programy nawet zaczęto wykorzystywać do przewidywania który kierowca spowoduje wypadek co może się przydać do sterowania ruchem

0

Wszystko zależy od ilości danych - jeżeli dane mieszczą się w pamięci to można używać prostych narzędzi Data Miningowych (jak Knime) i języków (jak Matlab, R).
Jeżeli się nie mieszczą ale danych wciąż jest na tyle mało, że algorytmy DM będzie działał w sensownym czasie to można skorzystać ze wsparcia baz danych do Data Miningu (jest np. Oracle Data Miner).
Jeżeli danych jest na prawde dużo to rozprasza się obliczenia na wiele komputerów (np. jest projekt Apache Mahout bazujący na Hadoop).

0

Mam jeszcze pytanie czy korzystacie w gotowców czy sami wymyślacie(poprawiacie) algorytmy?

1 użytkowników online, w tym zalogowanych: 0, gości: 1