Droga do kariery w Data Science? czy warto ?

0

Witam, jestem studentem już 2 roku i zastanawiam się nad swoją karierą... Tak, więc lubię programować, ale tylko SWOJE RZECZY, męczy mnie poprawianie czyjegoś kodu. Lubię też analizować dane przy pomocy statystyki. Chyba bardziej odpowiada mi kariera w Data Science, ze względu na rozwój i możliwości AI. Tym bardziej, że od znajomych nasłuchałem się o spagetti kodzie, kiepskiej dokumentacji i frustracji - czyli "blaski" pracy developera.

Więc jak wygląda dzień z życia data scientist? czy warto w to inwestować czas? czy trudno z pracą? Jakie wymagania na start? Jakie polecacie książki i materiały do nauki? najlepiej - teoria + kod

Chciałbym uzyskać odpowiedzi od ludzi zaznajomionych z tematem :)
@vpiotr zajmujesz się data science ?

1

Podpowiem zależy od Ciebie popisz sobie trochę w pythonie spróbuj zrozumieć sieci neuronowe i DL i zobaczysz czy warto
BTW. co do pracy na pewno dużo ciężej niż jako normalny programista

1
Zimny Kaczorek napisał(a):

Chciałbym uzyskać odpowiedzi od ludzi zaznajomionych z tematem :)
@vpiotr zajmujesz się data science ?

Aktualnie nie. Ale jak będziesz miał jakiś pomysł na jakiś krótki projekt (Java, C++, Python, Julia) to pisz.
Ale z tego co wiem to w tej dziedzinie na jakość kodu nie ma co liczyć. Pisał o tym @Julian_ , coś nie coś też widziałem na prezentacjach.
Jeśli trafisz do jakiejś małej komórki gdzie jesteś sam sobie sterem i żeglarzem to myślę że masz szansę zrealizować swoje cele.
Nie każda firma ma dział IT zaludniony setkami programistów. Znam banki w których pracuje <5 ludzi w IT. W takiej firmie miałbyś pole do popisu.
Bywa też że do analiz wydzielona jest niezależna od IT komórka w firmie.

0

Hej,
generalnie temat rzeka... Na pewno warto znać dobrze jakiś program/środowisko do obróbki danych... może to być Excel (czasem można ogarnąć temat w 5 minut zamiast pisać jakiś kod od zera)... jakieś wyspecjalizowane BI... może być Python + możliwości obróbki danych w Pandzie... może też być program R, sporo w nim można zrobić... i jeszcze coś by się znalazło... Druga sprawa, to umiejętność wdrażania się w Nowe Technologie... Teraz modne są na Zachodzie tematy związane z Big Data (technologie równoległe rozwijane np. w oparciu o Hadoop i MapReduce)... Niekoniecznie trzeba wchodzić w szczegóły (to znaczy jak to działa), ale warto np. znać Sparka, aby wiedzieć, jak obrabiać większe zbiory danych wykorzystując równoległe przetwarzanie danych (trudne to bardzo nie jest)... Jak już będziesz miał umiejętności wyżej wymienione, to warto wtedy głębiej wejście w ML... ale to jest taaak szeroka tematyka, że ciężko ją objąć w paru zdaniach... Spark ma wbudowane dużo ciekawych objektów ML... Ponadto warto znać podstawy AI: Sieci Neuronowe, Alg Genetyczne... Warto wiedzieć także co to są systemy rozmyte i systemy regułowe...

0

Albo idź w zwykłą webdeweloperkę jako freelancer i nawiąż współpracę np. z różnymi instytucjami naukowymi, sensowniejszymi kołami naukowymi itp.

2
Zimny Kaczorek napisał(a):

Tym bardziej, że od znajomych nasłuchałem się o spagetti kodzie, kiepskiej dokumentacji i frustracji - czyli "blaski" pracy developera.

Aż muszę dorzucić trzy grosze w kwestii uciekania przed spaghetti kodem do Data Science :)

Prototyp aplikacji, który dostaliśmy w pracy od tych tam data scientistów, został napisany przez nich tak, jakby chcieli zrobić PoC "interpreter Pythona przełknie spaghetti carbonara". Napisany był niezrozumiale, miejscami to w ogóle pełen dziwnych workaroundów i konstruktów działających jedynie na słowo honoru (potem i tak się okazywało że jednak nie zawsze), bez dokumentacji z prawdziwego zdarzenia i z "samodokumentującymi" się funkcjami w stylu:

    def wghtd_dnf_kwz4_5(asd, wght_a, wght_na, qwke, zxcv, dfggg = None, sdasd = 123, sdff = "AS_64", dscds = "Tytytytytyty", ten_tego_tutaj_sie_staramy_nazwac=None, atujuznie=-1, yetanothermeaningless_ahem_meaningfulmagicnumber=124233333232444, onedoesnotsimplyusenumber=int("1")):

które w dodatku wołały siebie nawzajem po 10 razy żonglując srylionami argumentów na wszystkie strony...

Tak, refaktorowanie tego to była czysta przyjemność. Porównywalna z rodzeniem kamienia nerkowego.

Tak, wierzę, że twórcy rozumieli kod, który napisali. Przez nie więcej niż tydzień.

Tak, jeśli chcesz uciekać w Data Science ze strachu przed użeraniem się z makaronem, to lepiej się dobrze zastanów ;)

0

hmmm... nie dziwie się kiepską jakością kodu napisanego przez Data Scientist, bo ten zawód jest bardziej związany ze statystyką(badaniem danych) niż programowaniem. Aby zastosować algorytmy Machine learning/Deep Learning potrzebna jest jedynie podstawowa wiedza o Pythonie. Z tego co już się dowiedziałem to ważne jest dobre zrozumienie matematyki/ekonometrii(od strony teoretycznej), działania algorytmów oraz znajomość narzędzi typu pandas czy tensorflow.
Nie chodzi tylko o spagetti kod, ale również o znużenie programowaniem, tak jak pisałem - wolę tworzyć kod niż naprawiać bugi. Natomiast AI jest ciekawym i wyzywającym zagadnieniem, w szczególności w zastosowaniu medycznym.

1 użytkowników online, w tym zalogowanych: 0, gości: 1