Wątek przeniesiony 2017-04-09 17:27 z Nietuzinkowe tematy przez Rev.

R,Python, Julia, Data Science

0

Po co używać w ogóle R do data science? Jedyną zaletą R nad Pythonem jest pare tysięcy bibliotek do statystyki, matematyki, matematyki finansowej itp. Czy nie lepiej jest przepisać wszystko do Pythona? Czemu część data scientistów to takie młoty? Czemu popularność R rośnie w tempie takim jak popularność pythona, mimo że R to kompletne badziewie i jego jedyną zaletą są te nieszczęsne biblioteki, które rozwijali przez ostatnie 20 lat profesorkowie zapaleńcy statystyki i które są rzeczywiście dobre, ale czy to znaczy że do końca świata mamy tkwić w tym zaklętym kole? Na grupie Data Science PL na fb dużo jest R-owców. Opamiętajcie się ludzie. Musimy coś z tym zrobić. Jakąś kampanie popularyzacji Pythona w Polsce. Trzeba jakoś przekonać tych profesorków z pw,agh,sgh,mim uw itp. do pythona.

0

@Julian_ @Shalom
Zapraszam do dyskusji ;)

0

Proponuję byś stworył lepszy język i nazwał go swoim imieniem. Będziemy wtedy programować w Jacku.

A co do R... nie zrozumie latania ten kto nigdy nie latał.

0

@Julian_:

Siedze w R i pythonie od dwoch lat, pod katem data science. W R glownie z przymusu. Python jest pod kazdym wzgledem lepszy. Składnia, obiektowość, biblioteki do sieci neuronowych, text miningu itp. Ostatnio chciałem się pobawić deep reinforcement learningiem, w R nic nie jest zaimplementowane. R to dobry jezyk dla amatorów, statystyków, analityków. Ale jak ktoś chce iść w kierunku najbardziej nowoczesnych odnóg data science, to w R jest pustka. Python jest lepszy.

0

A wizualizowałeś coś kiedyś? R ora po całości wszystkie języki świata jeśli chodzi o wizualizację danych, pozwala na najpiękniejsze na świecie interaktywne wizualizacje. Do tego automatyzacja raportów i wsparcie reproductible research.

Jedyną prewagą Pythona nad Rem była szybkość - przy dużej ilości danych. Teraz kiedy narodziła się Julia, która jest nawet szybsz od Javy, Python już nie ma sensu.

0

https://www.ibm.com/developerworks/community/blogs/jfp/entry/Python_Meets_Julia_Micro_Performance?lang=en

This table shows that optimized Python code is faster than Julia for the first 6 examples, and slower for the last 2. Note that for Fibonacci I used the recursive code to be fair.

0
JacekJackiewicz napisał(a):

Po co używać w ogóle R do data science?

Odpowiedzią jest:

JacekJackiewicz napisał(a):

R to dobry jezyk dla amatorów, statystyków, analityków.

  • Analityków i statystyków potrzeba coraz więcej, a R jest moim zdaniem łatwiejszy dla kogoś kto nigdy nie miał styczności z programowaniem. Instalujesz R i Rstudio i tyle wszystko śmiga.
  • Większość analiz w wielu branżach odbywa się na niewielkich wolumenach danych więc prędkość nie ma znaczenia.
  • Struktury danych w R są bardzo intuicyjne dla grupy docelowej (potwierdza to popularność pandas w pytonie ).
  • Po prostu jest dobry w tym co robi i nie ma nic złego w tym, że są to wąskie zastosowania o ile nikt nie próbuje na siłę ich rozszerzać.

W pytonie możesz zrobić dokładnie to samo, czy lepiej i szybciej to kwestia sporna, ale mam wrażenie, że to taki data sciencowy odpowiednik dyskusji niektórych programistów nad wyższością Javy nad C# i odwrotnie.

0

szach mat czego? Ze nadal nie jest popularny i ciezko w nim znalezc prace? Szczegolnie bezmyslnym fanatykom ktorzy tylko narzekaja i daja linki do statystyk bez kontekstu?

2 < 3

zacznij od prostej matematyki. Pozniej mozesz sie bawic w zapytania o ilosc pracy w danym jezyku. Jak nauczysz sie matematyki (podstaw) to zobaczysz, ze wynikow na rzecz pythona bedzie wiecej

1

W bionaukach używa się tylko SAS i R, na zachodzie jeszcze paru innych kombajnów, ale z języków programowania to tylko te dwa. W Pythonie nie ma po prostu nic specjalnego, co mógłby zaoferować bio data scjentystom. OK, może poza genetyką, gdzie Python ma troszkę rzeczy, ale to nie do porównania z BioConductorem nawet. W farmacji i pochodnych nie używa się machine learning bo nie ma po co, tylko czystej statystyki i to bardzo specjalistycznej statystyki. Python jest lepszy w machine learning, za to taka specjalistyczna statystyka w nim to zaledwie wycinek, raczej nierozwijany, kto pracował ten wie. Nie ma nawet dobrych metod do imputacji danych, tylko podstawowe. Medycy mają swoje metody statystyczne, których w Pythonie po prostu brak, a tych ledwie parę co są to na żenującym poziomie. I to zrozumiałe. Bo niby po co je rozwijać, kto miały to robić? Komu mogą być potrzebne, to siedzi w SAS albo R. A ci, co im to niepotrzebne, i tak nie wiedzą gdzie szukać wiedzy na ten temat i nie mają zamiaru tracić czasu. Pythoniści zachłysnęli się big data i machine learning, więc tutaj rozwijają jego możliwości. I tutaj Python jest mega. Ale big kasa to nie tylko big data, a tam potrzeba statystyki, i tam Python raczej nie podskoczy, bo kuleje i to mocno. Myślę, że oba języki po prostu się podzieliły rynkiem. O ile jeszcze flame między javą a c# ma rację bytu, bo ich domeny się w 100% nakładają, to tutaj nie ma to sensu, bo oba środowiska służą do czego innego. Dla przeciętnego eRowca kod w Pythonie jest nieczytelny. Dla Pythonisty kod w R to rzeźnia. Obserwacja na podstawie kilku roczników studentów i kilkudziesięciu konferencji z naukowcami programistami R, którzy zobaczyli ten sam kod w Pythonie i ręce im opadły. Dla programisty to nie problem, bo programista zrozumie kod w każdym, nawet nieznanym sobie języku, przez analogię. Dla naukowca to ma wielkie znaczenie, bo on uczy się konkretnego narzędzia. O ile test t Studenta można odpalić w obu środowiskach, to już bardziej zaawansowana statystyka dziedzinowa w Pythonie to parodia. Za to np. tworzenie GUI w Pythonie jest przyjemne, a w R uciążliwe, w GTK albo Tcl/Tk. Swoją drogą to R wszedł do MS SQL Servera i PowerBI i to w niego Microsoft zainwestował w 2016 i 2017, nie mówiąc o Oracle, które wypuściło R Enterprise. Ale i Pythonem MS się podobno interesuje, więc może oba języki będą wspierane przez jego narzędzia analityczne.

1 użytkowników online, w tym zalogowanych: 0, gości: 1