Rozwój kariery w BI/BigData/DataScience

2

Cześć,

Licze, że ktoś mi doradzi jak aktualnie rozwinąć swoją karierę. Obecnie pracuję w dziedzienie Oracle Business Intelligence, gdzie wdrażamy wewnętrzne projekty w firmie. Pracuję już w tym około ~2lat, na pełny etat. Jestem po studiach informatycznych, więc mam doświadczenie w programowaniue (podstawowe, uczelniane) w językach C++/Java/Python.
Aktualnie myślę o rozwijaniu się w innych technologiach żeby poszerzać swoją wiedzę, ponieważ w Polsce nie ma dużo możliwości jeżeli chodzi o Oracle BI.
W jakim kierunku byście proponowali podążać? Dodam, że interesują mnie głównie tematyki związane z danymi - stricte programowanie jakoś nie za bardzo mnie wciągło.
Rozmyślam nad kilkoma ścieżkami jak np: poznanie innych technologii BI (microsoft/qlik/tableau ..), Big Data (jednak tu trzeba wdrożyć się w Jave/Scale chyba, przy zastosowaniu np. Hadoop/Spark?) lub coś w kierunku Data Science jednak to pojęcie jest dość szerokie.
Najbardziej interesuję mnie przetwarzanie danych, ich modelowanie/analiza, wizualizacja/raportowanie.

Czy ktoś bardziej doświadczony w tym tematach mógłby troche mnie nakierować?

3

Pozwolę sobie trochę naprostować:
Zamiast Big Data / Data Science użyłbym terminów Data Engineering / Data Science.

W dużym skrócie Data Science to tworzenie modeli od strony matematycznej a Data Engineering to ich implementacja, np. w technologiach które wymieniłeś.
Oczywiście część ofert pracy łączy w sobie oba powyższe.
Big Data to taki buzzword który już nie wiadomo co znaczy :)

Teraz co do wejścia w te branże:
Jeżeli Data Engineering, to bez dobrej znajomości jednego z języków Java / Python / Scala ani rusz.
Więc jeżeli chcesz iść tą ścieżką to zacznij od tego. Zapewne w Twojej firmie szukają programistów tych języków więc może spróbuj tak to rozegrać.

Jeżeli Data Science to będzie trudniej, bo musisz ogarnąć sporo matmy / statystyki i na pewno też jakis język typu Python / R.

Podsumowując niezależnie co wybierzesz, zdobądź najpierw solidne podstawy w programowaniu.

0

Dzięki za szybko odpowiedź.

Akurat w mojej firmie raczej nie zajmują się takimi tematami, tylko mamy dział BI spokrewnionego z tą tematyką, dlatego pozostaje rozwój osobisty/zmiana pracy.
Nawiązując do Twojej odpowiedzi, muszę przypomnieć sobie/nauczyć się programowania w Java/Python/Scala/R. Gdzie czytałem, że najlepiej uczyć się Scala, czy prawda? Chyba, że mógłbyś polecić, który jezyk wybrać najlepiej z połączoną technologią, tzn: rozwijać się w Scala + Spark?
Mam jeszcze dwa pytanie.
Aktualnie zajmuje się bazami danymi Oracle, a czy w związku z Data Engineering warto nauczyć się innych baz/typów jak np. NoSQL?
Drugie pytanie, czy warto udać się na studia podyplomowe związanymi DataSciene/BigData np. na SGH w Warszawie?

1

Gdzie czytałem, że najlepiej uczyć się Scala, czy prawda?

Nie. Nie ma jednoznacznej odpowiedzi na pytanie czego najlepiej się uczyć.
Pytań jaki język wybrać jest na tym forum miliard, akurat Scala na start może być za trudna i będziesz miał problem ze zrozumieniem pewnych koncepcji jeżeli nie masz solidnych podstaw w programowaniu obiektowym i przynajmniej podstaw programowania funkcyjnego.

Chyba, że mógłbyś polecić, który jezyk wybrać najlepiej z połączoną technologią, tzn: rozwijać się w Scala + Spark?

Z pierwszego posta wywnioskowałem, że doświadczenie w programowaniu masz bliskie zera (projekty na studiach raczej nie były szczególnie ambitne), więc dopóki nie czujesz się pewnie w jakimś języku to zapomnij o frameworkach typu Spark. Po prostu nie znajdziesz pracy w tym obszarze bez wcześniejszego doświadczenia.

Aktualnie zajmuje się bazami danymi Oracle, a czy w związku z Data Engineering warto nauczyć się innych baz/typów jak np. NoSQL?

Na pewno warto mieć ogólne pojęcie o tych bazach, ale nie spędzałbym nad tym nie wiadomo ile czasu. Jak trafisz do projektu gdzie takie bazy się wykorzystuje (albo wykorzystasz w swoim własnym) to się nauczysz. Chociaż jeżeli Cię ciągnie do tej tematyki to śmiało.

Drugie pytanie, czy warto udać się na studia podyplomowe związanymi DataSciene/BigData np. na SGH w Warszawie?

Nie studiowałem tam, ale moim zdaniem nie. Jeżeli już to PW / UW, ale też byłbym sceptyczny co do podyplomówek.

0

Jak w ogóle oceniacie tę kierunek rozwoju związany z Big Data/Data Science + Scala , Python... może Machine Learning?

0

@macok troszkę pojechałeś, bo akurat podyplomówki na SGH są spoko, a sama uczelnia od lat ma wiodący kierunek MIESI i od rok/dwóch kierunek 2 stopnia Big data

0

Super narzędzie Big Data : http://www.exmetrix.com/ !! Zaskoczyła mnie ta sprawdzalność, sami zobaczcie !

0

Jak Jesteś po informie, programowanie Cie nie kręci, Interesujesz się "Big Data"(whatever it is) to Bierz się za neural networks, etc.. matematycznie Ogarniesz; no i jest to fajne, przyszłościowe i... działa:)

0

za moich czasów nie było czegoś takiego jak data scientist. Dawniej tych ludzi się nazywało zwyczajnie statystykami albo analitykami, a gości od baz danych analitykami/architektami/inżynierami hurtownii/baz danych.

0
Julian_ napisał(a):

za moich czasów nie było czegoś takiego jak data scientist. Dawniej tych ludzi się nazywało zwyczajnie statystykami albo analitykami, a gości od baz danych analitykami/architektami/inżynierami hurtownii/baz danych.

A za moich czasów zwrotu "za moich czasów" używali tylko ludzie po 50tce. Zaskakujące jak młodzieżdzisiaj szybko dojrzewa/

0
choracy69 napisał(a):

Cześć,

Licze, że ktoś mi doradzi jak aktualnie rozwinąć swoją karierę. Obecnie pracuję w dziedzienie Oracle Business Intelligence, gdzie wdrażamy wewnętrzne projekty w firmie. Pracuję już w tym około ~2lat, na pełny etat. Jestem po studiach informatycznych, więc mam doświadczenie w programowaniue (podstawowe, uczelniane) w językach C++/Java/Python.
Aktualnie myślę o rozwijaniu się w innych technologiach żeby poszerzać swoją wiedzę, ponieważ w Polsce nie ma dużo możliwości jeżeli chodzi o Oracle BI.
W jakim kierunku byście proponowali podążać? Dodam, że interesują mnie głównie tematyki związane z danymi - stricte programowanie jakoś nie za bardzo mnie wciągło.
Rozmyślam nad kilkoma ścieżkami jak np: poznanie innych technologii BI (microsoft/qlik/tableau ..), Big Data (jednak tu trzeba wdrożyć się w Jave/Scale chyba, przy zastosowaniu np. Hadoop/Spark?) lub coś w kierunku Data Science jednak to pojęcie jest dość szerokie.
Najbardziej interesuję mnie przetwarzanie danych, ich modelowanie/analiza, wizualizacja/raportowanie.

Czy ktoś bardziej doświadczony w tym tematach mógłby troche mnie nakierować?

Jak szanowny forumowicz stoi z matematyką?

1

Big Data, to zbyt ogólne pojęcie.

Generalnie masz takie ścieżki w tym zakresie:

  • Data Science: Python + Machine Learning - statystyka, modele matematyczne, etc. Frameworków jest do tego typu rzeczy jest multum, a większość z nich w Pythonie. Nie jest to typowo inżynierska ścieżka. Taka bardziej naukowo-eksperymentalna i bardziej liczy się znajomość matematyki, statystyki, umiejętność tworzenia raportów, analizy danych, wyciągania z tego wniosków, niż developmentu jako takiego.
  • Development: Java, Scala, Python -> Stream Processing (np. Flink i Spark) i produktyzacja pracy osób zajmujących się Data Science. Tutaj nie trzeba mieć specjalnej wiedzy ze statystyki i Data Science, tylko taką ogólną. Trzeba mieć wiedzę z zakresu języka, w którym piszesz (zazwyczaj będzie to Java lub Scala), frameworka, z którego korzystasz i wzorców/zasad obowiązujących w tego typu projektach (stabilne działanie, skalowalność, low-latency, itd.).

1 użytkowników online, w tym zalogowanych: 0, gości: 1