Jak najprościej sprawdzić korelację pomiędzy jakimiś zjawiskami?

1

Nie znam się zupełnie na data science, a czasem z ciekawości chciałbym sprawdzić jakie są zależności statystyczne między dwoma, lub więcej zjawiskami, np. średnia ilość wypijanego mocnego alkoholu na człowieka w danym kraju, a liczba przypadków zachorowań na koronawirusa.
Jest jakaś strona z obszernymi bazami danych (pewnie to kosztuje pieniążki) gdzie można sobie porównywać, czy to jednak bardziej zaawansowany temat wymagający znajomości Pythona, R i jeszcze jakichś narzędzi datasciense'owych

1

Z tego co kojarze, to w Polsce GUS udostępnia dane statystyczne przez API i chyba nawet za darmoszkę

1
  1. Korelacja nie oznacza przyczynowości.
  2. Jeśli masz dane, to obliczenie korelacji jest całkiem proste

Ogólnie największym problemem przy tym co chcesz policzyć będzie zdobycie odpowiedniego zbioru danych, a nie policzenie samej korelacji. Przy czym nawet jak policzysz korelację to pamiętaj o pkt. 1) czyli, że korelacja (lub jej brak) nie oznacza przyczynowości.

0

Tak, corelation is not casuation , ale niekoniecznie jest to takie proste, nauce słabo idzie z przyczynowością, korelacje łatwiej znaleźć; a na przykład korelacja palenia fajek z rakiem płuc, jest już przyczynowością, więcej:
https://duckduckgo.com/?q=correlation+is+not+causation+hacker+news&t=canonical&ia=social

0

Jest taki język - R - i tam są proste metody na sprawdzenie korelacji.
Takie coś zauważyłem, wydaje się ciekawe, bo z przykładami: http://www.sthda.com/english/wiki/correlation-test-between-two-variables-in-r
Tamże: http://www.sthda.com/english/wiki/correlation-matrix-a-quick-start-guide-to-analyze-format-and-visualize-a-correlation-matrix-using-r-software

1 użytkowników online, w tym zalogowanych: 0, gości: 1