Jak zostac "kotem" w Data Science?

0

Hej,

Rozwazam podjecie studiow na kierunku Data Science, i poprzednio nie bylem nigdy zwiazany z IT. Na ten moment nie umiem zbyt duzo.

Chcialbym sie tylko dowiedziec czego dokladnie powinienem sie uczyc, zeby dostac kiedys prace jako Data Scientist. Mam duzo wolnego czasu i chce sie temu poswiecic 100%. Jakies pomysly? Czego powinienem sie uczyc? Jakie projekty powinienem robic?

5

Matematyki i statystyki. Jakieś absolutne podstawy pythona też mogą się kiedyś przydać.

3
Mario30 napisał(a):

Czego powinienem sie uczyc? Jakie projekty powinienem robic?

Dzisiejsza oferta, dość dobrze opisana, opis bez banałów w rodzaju owocowe wtorki

Data Scientist, Transaction Monitoring Optimisation - Analytics
Miejsce pracy: Warszawa

**Szukamy Ciebie jeśli:
**Łatwo angażujesz się w dyskusje nad skomplikowanymi procesami, a także posiadasz łatwość w wyjaśnianiu ich szerszej publiczności,
Posiadasz szeroką wiedzę z zakresu relacyjnych baz danych oraz optymalizacji zapytań,
Znasz platformy takie jak Apache Hadoop oraz Spark,
Posiadasz wiedzę z zakresu segmentacji danych punktowych oraz rastrowych w środowisku wolnodostępnego oprogramowania R (DBSCAN),
Masz doświadczenie z językiem Python oraz modułami pandas, sklearn, pyspark, numpy,
Masz doświadczenie z językiem SQL,
Masz doświadczenie w pracy z oprogramowaniem Linux oraz wierszem poleceń,
Chcesz wspierać rozwój oraz stałe ulepszanie przetwarzania potokowego (Data pipelines),
Masz doświadczenie z wnioskowaniem statystycznym,
Masz doświadczenie w pracy dla międzynarodowych, rozbudowanych organizacji o strukturze macierzowej z kadrą kierowniczą/ programem zarządzania,
Posługujesz się biegle językiem angielskim w mowie i piśmie.
**Dodatkowo zapunktujesz za:
**Dobra znajomość języka holenderskiego lub francuskiego,
Doświadczenie w optymalizacji procesów Transaction Monitoring w AML w międzynarodowych instytucjach finansowych,
Certyfikat AML (ACAMS, ICA).
Doświadczenie w międzynarodowych instytucjach finansowych,
Posiadanie ekspertyzy z obszaru AML/TM,
Umiejętność optymalizacji procesów.
**Jak pracujemy
**Naszym celem jest wspieranie optymalizacji zadań powiązanych z naszymi programami regulacyjnymi, aby zapewnić optymalne konfiguracje dla systemów monitorujących opierających się na regułach globalnych przed wejściem w życie. Te globalne systemy monitorują transakcje naszych klientów w ramach wyszkania wskaźników finansowych lub ekonomicznych przestępstw. Regulowanie, testowanie oraz optymalizowanie tych systemów jest wymogiem regulacyjnym, gdzie wymagane użycie jest statystycznych, badawczych programów oraz operacji aby móc zapewnić określone standardy. Po wejściu systemu opartego na regułach w życie, należna jest jego ciągła kalibracja oparta na analizach tworzonych przez zespół analityczny.
**Kluczowe elementy roli:
**Współpraca z innymi osobami na stanowisku Data Sciencist w ramach symulacji systemu opartego na regułach oraz wyszukiwanie zdarzeń, które podlegają analizie Alert Investigator Team,
Przekazywanie informacji w celu ustanawiania progów, które wspomagają minimalizację ilości błędów statystycznych,
Tworzenie oraz testowanie scenariuszy wspomagających rozumienie jak zmiany danych w systemie wpływają na jego efektywność oraz wydajność,
Proponowanie dodatkowych zasad wspomagających wzrost produktywnych alertów,
Interpretacja oraz analiza problemów statystycznych, a także zapewnianie zgodnych i poprawnych jakościowo danych
Dostosowanie się do panujących standardów wobec dokumentacji przy użyciu systemów version control oraz code repositories (Git, GitHub, Markdown),
Wykorzystywanie narzędzi do wizualizacji danych w celu lepszej prezentacji danych dla podmiotów zainteresowanych.
**Zakres obowiązków
**60% - Wykonywanie oraz wspieranie aktywności optymalizacyjnych
40% - Tworzenie oraz rozwijanie nowych narzędzi wspierania procesów optymalizacyjnych

3

Bierz udział i wygrywaj zawody na kaggle.com.

2

Język R też się przyda. Nauka uczenia maszynowego też się przyda w data sajensach.

1

BTW, na kanale na youtube freecodecamp są fajne kursy data science. Sam przerabiam, ciekawa forma. I w Pythonie, i w R I sama teoria wraz z matematyka, statystyka i później już takie kursy dla zaawansowanych. Kursy niestety po angielsku, ale jak znasz podstawy to włącz napisy, zresztą fajnie tłumacza tam za pomocą grafik. Pełno kursów tam jest, poza tym jest dssconf, wpisz w Google, nawet na forum o tym jest.

1
KHX napisał(a):

Język R też się przyda. Nauka uczenia maszynowego też się przyda w data sajensach.

Może ktoś z korzysta przy nauce ML i R https://otexts.com/fpp2/.

2

Data Science to głównie matematyka i odrobina programowania.
Polecam przerobienie kursów:
Statystyka:
Kursy poruszające tematy algebry liniowej całkiem spoko są te z https://www.khanacademy.org/
Przy Uczeniu maszynowym warto też poznać analizę matematyczną (głownie pochodne)

Bardziej zaawansowanymi zagadnieniami z matematyki to na pewno pochodne funkcji wielu zmiennych.

W między czasie możesz uczyć się Pythona + biblioteki takie jak NumPy, Pandas, Matplotlib.
Potem możesz powoli wprowadzać się w świat uczenia maszynowego i ogarniania biblioteki scikit-learn.

Data Sciene to dość obszerny temat, więc i dużo nauki Cię czeka.
Co do projektów to podstawowe projekty to np. Przewidywania cen mieszkań / domów / działek. Albo Klasyfikacja czy osoba przy podanych cechach może być na coś chora czy nie.

Zalecam zapoznać się też zapoznać z MiniCondą i Jupyterem bo pewnie w tym będziesz kodził i pokazywał swoje dokonania :)

1 użytkowników online, w tym zalogowanych: 0, gości: 1