Rozkład prawdopodobieństwa

0

Witam,

Mam problem natury chyba statystyczno algorytmicznej.

Obrazowo:
Mam X "czujników", każdy czujnik ma 2 wejścia, na który wpadają "dowolne" wartości z przedziału 0..1.
Pomiary dokonywane są co określony czas.
Weźmy dla uproszczenia dwa "czujniki".

Na wejściu otrzymujemy
1.) czujnik A: 0.4 0.2, czujnik B: 0.1 0.7
2.) czujnik A: 0.11 0.65, czujnik B: 0.53 0.35
...
itd. itd.
W którymś momencie dostaję na wejście
np. czujnik A: 0.76 0.1 czujnik B: 0.1 0.2
I na wyjściu chcę obliczyć na którym czujniku dana para wejść ma większe prawdopodobieństwo, oczywiście wcześniej taka para wcale nie musiała paść.
Czujników jest jak wspomniałem X, chciałbym poznać nawet nie prawdopodobieństwa a raczej stosunki prawdopodobieństw między wartościami poszczególnych "czujników". Jednym zdaniem, chcę obliczyć rozkłady prawdopodobieństw par liczb na poszczególnych czujnikach.

Każda wskazówka się przyda.

0

Generalnie musisz założyć pewien rozkład prawdopodobieństwa (np. rozkład Gaussa) i ustalić parametry dla tego rozkładu na podstawie danych które już masz, dla każdego czujnika osobno. Jeżeli czujnik ma n wejść to korzystasz z n-wymiarowego rozkładu. Parametry rozkładu najczęściej ustala się przez Maximum Likelihood Estimation.
Gdy przychodzą nowe dane na czujniki to po prostu podstawiasz wartości do wzoru na prawdopodobieństwo z wcześniej policzonymi parametrami.
Przy wybieraniu rozkładu prawdopodobieństwa najlepiej sobie wykreślić histogram z próbek, które już masz i potem pomyśleć na jaki rozkład to wygląda.

0

@0x200x20
(Dzięki za wskazówki)
hm...problemem A, jest to,że nie wiem jaki będzie rozkład prawdopodobieństwa (może on się nawet zmieniać w trakcie), tak że próbka mi się na nie wiele zda(i obawiam się, że to może być nie tylko rozkład Gaussa) .
Cały myk polega w zasadzie na ciągłym obliczaniu, a raczej uaktualnianiu rozkładu (i najlepiej, abym nie trzymał historii starych pomiarów, bo zajmują pamięć i całkiem stare już są nie aktualne), jak pisałem w pierwszym poście, to nawet nie musi być dosłownie prawdopodobieństwo byle bym mógł porównać wartości między czujnikami. Jeszcze raz dzięki, na pewno przyjrzę się temu Maximum Likelihood Estimation.

Zakładając, że mam jakiś rozkład prawdopodobieństwa (nie istotne jaki) i nie mając historii, tylko nowe wejście da się jakoś łatwo uaktualnić model? hm...muszę doczytać.
PS.
Ciągle czuję, że to jest proste tylko coś mi umyka z pola widzenia ;)

0

W przypadku rozkładu Gaussa możesz sobie parametry uaktialniać inkrementalnie (sa tylko dwa: srednia i wariancja, obydwa można liczyć inkrementalnie).
Jeżeli sam rozkład może się zmieniać to zastosuj jakiś nieparametryczny model (czyli taki w którym nie zakładasz, że istnieje jakiś rozkład prawdopodobieństwa).
Przykładem takiego modelu jest k najbliższych sąsiądów (k-NN)

1 użytkowników online, w tym zalogowanych: 0, gości: 1, botów: 0