Data Scientist vs Data Analyst vs Data Engineer w Polsce

0

Hej,
Chciałem zapytać tak jak w temacie o różnice między specjalizacjami Big Data i czy są one w ogóle rozróżniane w Polsce, patrząc na ogłoszenia raczej mam wrażenie że zakres obowiązków często się pokrywa. Pytam w kontekście rozwijania się w dziedzinie Big Data, ale na razie badam temat i się zastanawiam czy już na starcie powinienem wybrać jedną z tych 3 ścieżek?

5

Był taki mem, nie mogę znaleźć, że szef jak chce mnie udobruchać, bo zarabiam za mało to zamiast dać mi podwyżkę to nadaje mojemu stanowisku jakąś skomplikowaną nazwę. To tak w praktyce.

W korporacjach, sfotwarehousach stosują czasem tę praktykę, by przyciągać kandydatów oraz by stwarzać pozory wyższego wyspecjalizowania załogi, gdy walczą o klienta. I tak potem okazuje się, że 5 letni javowcy są już starszymi architektami, a w zespole masz 3 głównych architektów i lidera, którzy po prostu piszą kod.

3

Są one rozróżnialne ale raczej w większych firmach, bądź w firmach z większymi MLowymi zespołami.
Glownie różnią się stackiem technologicznym, data engineer pewnie siedzi bliżej clouda i pipelinow, data analyst bliżej wizualizacji, może jakieś dashboardy, a data scientist bliżej modeli i predykcji. Natomiast zakres obowiązków i umiejętności często jest dość rozmyty u poszczególnych osób, a i firmy czasami mniej ogarniają - warto się dobrze dopytać na rozmowie rekrutacyjnej o zakres obowiązków, żeby wiedzieć na co się tak naprawdę aplikuje.

Czy na starcie musisz coś wybierać? Ja proponuję popróbować wszystkiego i masterowac to co da Ci najwięcej radości ;)

1

Generalnie, Data Analyst brzmi "biznesowo", Data Scientist - jakieś "PhD", w sumie wyżej niż, Data Engineering; a, Data Engineering to już może być programista po obejrzeniu fast.ai na YouTube.

45

W data rozróżnia się już nawet backend i fronted :P Backend czyli wszelkiej maści etl'e a frontend to właśnie mieszanka takiego data analysta -> Wizualizacja, bi itp.

W co byś nie poszedł w Big Data, to na pewno będzie to cloud, sql, python / scala / java.

0

Zapomnieliscie jeszcze o Business Intelligence Developer oraz Data Mining Specialist

0

Moge ci napisac z grubsza jak to u nas wyglada, ale tak jak pisali wczesniej moze to sie roznic w zaleznosci od firmy. Szczegolnie w jakims korpo gdzie stanowiska sa wymyslane na biezaco pod pracownikow. U nas w firmie (~10 osob) mamy inzynierow i BI developerow, choc wlasnie z racji tego, ze jest nas malo czasem ktos musi wykonac cos nie ze swojej dzialki. No i jest jeszcze szef, ktory jest data architectem, czyli on ogarnia wszystko i jeszcze wiecej :P
Engineer zajmuje sie u nas glownie ETLami. Najpierw pobiera dane w surowej formie z innego zrodla np. z sapa. Potem je czysci z jakis duplikatow, grupuje itp. Na samym koncu przygotowuje pod konkretny problem biznesowy. Do tego zarzadza procesami ladowania danych - trzeba robic to umiejetnie zeby nie zarznac systemow oraz jak sie pojawi jakis blad, naprawic. Developer przejmuje robote od momentu jak dane sa juz przygotowane pod konkretny problem. Robi z nich modele, pisze miary (KPI itd) jakie sobie biznes wymyslil. Na koncu przeprowadza testy z biznesem i w razie potrzeby rozwija model. Analitycy sa juz po stronie biznesu i oni z tych raportow wyciagaja jakies tam wnioski. O scientistach nie slyszalem (moze klient jakis ma), ale ogolnie roznica jest taka, ze analyst odpowiada na pytania "co sie stalo?", "dlaczego tak sie stalo?", a scientist "co sie stanie w przyszlosci?".

Co do stacku. Polecam zainteresowac sie Databricksami (sql, python). Jest to unicorn branzy big data zaimplementowany w kazda z wiekszych chmur (azure, aws, gcp). Pomiedzy chmurami rozni sie ewentualnie tylko linijka kodu jaka trzeba napisac zeby podpiac dane. Do tego jakis program wizualizujacy np. tableu czy PBI i bedzie git na poczatek.

0

Różne nazwy stanowisk na wykonywanie tych samych czynności w Excelu. Teoretycznie data scientist to ktoś kto ma odkryć jakieś korelacje w danych, analityk potrafi te korelacje przełożyć na język biznesu, a inżynier ma znaleźć sposób na sprawne przetwarzanie dużych zbiorów. W praktyce nie wyobrażam sobie, żeby taki data scientist mógł sprawnie pracować nie mając pojęcia o potrzebach biznesowych i nie potrafił zakodować jakiegoś tam kawałka w Pythonie, albo innym R.

1 użytkowników online, w tym zalogowanych: 0, gości: 1