Analiza danych - biblioteki

0

Witam ponownie. Poznaję tematy analizy danych w Pythonie (Pandas) . I tu mam pytanie jakie najczęściej biblioteki się uzywa w analizie danych. Jakie sa wykorzystywane biblioteki np. w pracy zawodowo? Czy można "ogarnąć" dobrze jedną bibliotekę , np. Pandas , zeby się tym zajmować. Czy lepiej znać kilka bibliotek ( jakich?) , czy zależy to od pracodawcy, który zatrudnia taką osobę do analizy danych? Jak Wy to widzicie ze swojej perspektywy( a może ktoś w tym pracuje zawodowo, zdalnie ?)

3

Pracowałem przez niedługi okres czasu jako Data Engineer, w zespole miałem kilku Data Scientistów, Analystów, o ile Pandas & Numpy są zazwyczaj kompletną podstawą przy żonglerce na danych, operacjach na nich to pozostałych bibliotek pozwalających dać lepszy wgląd w dane przy analizie jest ponad kilka, zależnie od upodobań pracujących kolegów różne mogą być używane. W moim przypadku w szczególności były to dodatkowo Scikit-Learn, do modelowania i Seaborn do wizualizacji.

1

Pytanie jest dosyć ogólne. Data Analyst to stanowisku raczej luźno związane z IT, nie jest to typowy programista. Sama analiza danych może się natomiast pojawić w pracy na stanowisku Data Engineer czy Data Scientist albo innych. Generalnie przyda się umiejętność pisania w Pythonie, np. asynchronicznego kodu czyli asyncio, aiohttp, a także podstawowe biblioteki pandas i numpy. W zależności czy to bardziej Engineer czy Scientist pojawiają się inne biblioteki takie jak pySpark czy w przypadku tego drugiego scikit-learn, tensorflow, keras.

1 użytkowników online, w tym zalogowanych: 0, gości: 1