Wątek przeniesiony 2017-04-09 17:27 z Nietuzinkowe tematy przez Rev.

R,Python, Julia, Data Science

Odpowiedz Nowy wątek
2017-04-09 19:12
JacekJackiewicz
0

Po co używać wogóle R do data science? Jedyną zaletą R nad Pythonem jest pare tysięcy bibliotek do statystyki, matematyki, matematyki finansowej itp. Czy nie lepiej jest przepisać wszystko do Pythona? Czemu część data scientistów to takie młoty? Czemu popularność R rośnie w tempie takim jak popularność pythona, mimo że R to kompletne badziewie i jego jedyną zaletą są te nieszczęsne biblioteki, które rozwijali przez ostatnie 20 lat profesorkowie zapaleńcy statystyki i które są rzeczywiście dobre, ale czy to znaczy że do końca świata mamy tkwić w tym zaklętym kole? Na grupie Data Science PL na fb dużo jest R-owców. Opamiętajcie się ludzie. Musimy coś z tym zrobić. Jakąś kampanie popularyzacji Pythona w Polsce. Trzeba jakoś przekonać tych profesorków z pw,agh,sgh,mim uw itp. do pythona.

Pozostało 580 znaków

2017-04-09 19:26
JacekJackiewicz
0

@Julian_ @Shalom
Zapraszam do dyskusji ;)

Pozostało 580 znaków

2017-04-09 22:39
0

Proponuję byś stworył lepszy język i nazwał go swoim imieniem. Będziemy wtedy programować w Jacku.

A co do R... nie zrozumie latania ten kto nigdy nie latał.

Nie zbanowali Ciebie jeszcze? Bosz, kiedy to zrobią w końcu - scibi92 2017-04-09 22:58

Pozostało 580 znaków

2017-04-09 23:37
0

@Julian_:

Siedze w R i pythonie od dwoch lat, pod katem data science. W R glownie z przymusu. Python jest pod kazdym wzgledem lepszy. Składnia, obiektowość, biblioteki do sieci neuronowych, text miningu itp. Ostatnio chciałem się pobawić deep reinforcement learningiem, w R nic nie jest zaimplementowane. R to dobry jezyk dla amatorów, statystyków, analityków. Ale jak ktoś chce iść w kierunku najbardziej nowoczesnych odnóg data science, to w R jest pustka. Python jest lepszy.

Pozostało 580 znaków

2017-04-09 23:43
0

A wizualizowałeś coś kiedyś? R ora po całości wszystkie języki świata jeśli chodzi o wizualizację danych, pozwala na najpiękniejsze na świecie interaktywne wizualizacje. Do tego automatyzacja raportów i wsparcie reproductible research.

Jedyną prewagą Pythona nad Rem była szybkość - przy dużej ilości danych. Teraz kiedy narodziła się Julia, która jest nawet szybsz od Javy, Python już nie ma sensu.

ale ten R jest taki suchy. chce np. zrobic jakas symulacje oparta na reinforcement learningu albo na czyms tam i na bazie tego zrobic gierke komputerowa albo appke. Przeciez w tym R sie nic nie da zrobic, to jest jezyk czysto statystyczny/wizualizacyjny, a nie jezyk ogolnego przeznaczenia jak python. - JacekJackiewicz 2017-04-10 00:19
nawet jak julia jest szybsza to i tak zanim kuce wykucują od zera te wszystkie biblioteki do backendu, webdevu itp. to miną lata świetlne, a tak masz pythona i masz w nim wszystko co trzeba: django, uczenie maszynowe, statystyka, wizualizacja danych, scraping i czego dusza zapragnie - JacekJackiewicz 2017-04-10 00:29

Pozostało 580 znaków

2017-04-10 00:03
0

https://www.ibm.com/developer[...]lia_Micro_Performance?lang=en

This table shows that optimized Python code is faster than Julia for the first 6 examples, and slower for the last 2. Note that for Fibonacci I used the recursive code to be fair.

Pokaż pozostałe 3 komentarze
taki R-owiec to może mi naskoczyć. wszyscy R-owcy to wypierdki, walizka na kółkach, karykatury człowieka. tylko Python - JacekJackiewicz 2017-04-10 00:49
pytam czy chcesz się bić? - Julian_ 2017-04-10 00:59
Tylko co to obrazuje? Są szybsze sposoby na obliczanie elementów ciągu Fibonacciego to raz. A dwa to jak trzeba szybkości to pod względem szybkości i tak języki kompilowane, typowane statycznie zaorają języki typowane dynamicznie. - drorat1 2017-04-10 10:01
http://stackoverflow.com/ques[...]hon-vs-c-using-blas-and-numpy nie jestem programista i sie az tak na tym nie znam, ale chyba te pythonowe biblioteki jak BLAS czy numpy,scipy są porównywalne jeśli chodzi o obliczenia numeryczne do javy,c++ itp. a w data science, statystyce itp. w sumie to jest najważniejsze. - JacekJackiewicz 2017-04-10 11:24

Pozostało 580 znaków

2017-04-10 00:05
0
JacekJackiewicz napisał(a):

Po co używać wogóle R do data science?

Odpowiedzią jest:

JacekJackiewicz napisał(a):

R to dobry jezyk dla amatorów, statystyków, analityków.

  • Analityków i statystyków potrzeba coraz więcej, a R jest moim zdaniem łatwiejszy dla kogoś kto nigdy nie miał styczności z programowaniem. Instalujesz R i Rstudio i tyle wszystko śmiga.
  • Większość analiz w wielu branżach odbywa się na niewielkich wolumenach danych więc prędkość nie ma znaczenia.
  • Struktury danych w R są bardzo intuicyjne dla grupy docelowej (potwierdza to popularność pandas w pytonie ).
  • Po prostu jest dobry w tym co robi i nie ma nic złego w tym, że są to wąskie zastosowania o ile nikt nie próbuje na siłę ich rozszerzać.

W pytonie możesz zrobić dokładnie to samo, czy lepiej i szybciej to kwestia sporna, ale mam wrażenie, że to taki data sciencowy odpowiednik dyskusji niektórych programistów nad wyższością Javy nad C# i odwrotnie.

Pokaż pozostałe 3 komentarze
R jest dla wybitnych. - Julian_ 2017-04-10 00:42
no ok w pythonie jak cchesz odpalić coś w scikit learnie też w sumie nie musisz wiedziec co to obiekt, a kod jest schludniejszy i prostszy do odczytu niż w R. w pythonowej pandzie dziecinnie prosto obrabia się dane i operuje na macierzach. akurat argument że R jest prostszy w użytkowaniu i wogóle prostszy, to chyba najgorszy argument jaki można przyjąć jako linie obrony R :D - JacekJackiewicz 2017-04-10 00:47
pandas to rok 2008 ile lat minęło zanim zdobyła popularność (swoją drogą ciekawe skąd twórcy czerpali inspirację ;))? Prawda jest taka, że jak piszesz proste skrypty, składnia nie ma znaczenia (nie mówiąc już, że preferencje co do składni są różne). Nie chce mi się jakoś strasznie rozpisywać tutaj mamy porównanie języków (https://www.dataquest.io/blog/python-vs-r/) z którym można mniej więcej się zgodzić. Co więcej, żeby z pythonem pracować podobnie do R potrzebujesz jupitera a i tak jest mniej wygodne i uboższe (przynajmniej na razie) rozwiązanie od tego co daje RStu - Crude Monte Carlo 2017-04-10 01:05
Java lepsza od C#? Przeciez za java stoi oracle... i dyskusja zakonczona.... - tamtamtu 2017-04-10 09:41
Gwoli ścisłości, Java jest otwartoźródłowa i stoi za nią trochę więcej firm niż tylko Oracle. Np. IBM, Red Hat, Apple i Google. - Krolik 2017-04-10 09:52

Pozostało 580 znaków

2017-04-10 08:27
0

Python: https://www.tiobe.com/tiobe-index/python/

R: https://www.tiobe.com/tiobe-index/r/

Szach mat.

Pozostało 580 znaków

2017-04-10 08:46
0

szach mat czego? Ze nadal nie jest popularny i ciezko w nim znalezc prace? Szczegolnie bezmyslnym fanatykom ktorzy tylko narzekaja i daja linki do statystyk bez kontekstu?

2 < 3

zacznij od prostej matematyki. Pozniej mozesz sie bawic w zapytania o ilosc pracy w danym jezyku. Jak nauczysz sie matematyki (podstaw) to zobaczysz, ze wynikow na rzecz pythona bedzie wiecej

Akurat argument z pracą nie jest zbyt trafiony, R to nie jest język dla deweloperów tylko dla data scientistów/statystyków/analityków, jak sobie poszukasz ofert pracy w tych zawodach to zobaczysz że w 80% R jest wymagany albo przynajmniej preferowany. Może w polsce nie jest to takie widoczne, bo do nas boom na data science dopiero przychodzi, ale w stanach, anglii, azjii są dziesiątki tysięcy tego typu ofert pracy. - JacekJackiewicz 2017-04-10 10:01
argument jest takiej samej jakosci jak ten powyzej z tiobe - fasadin 2017-04-10 10:04
no czyli nie jest trafiony, po co sie przyznajesz do bledu hehe? - JacekJackiewicz 2017-04-10 10:05
bo nie jestem hipokryta jak niektorzy i potrafie przyznac sie do czegos co zrobilem (szczegolnie swiadomie) - fasadin 2017-04-10 10:07

Pozostało 580 znaków

2017-05-22 20:44
1

W bionaukach używa się tylko SAS i R, na zachodzie jeszcze paru innych kombajnów, ale z języków programowania to tylko te dwa. W Pythonie nie ma po prostu nic specjalnego, co mógłby zaoferować bio data scjentystom. OK, może poza genetyką, gdzie Python ma troszkę rzeczy, ale to nie do porównania z BioConductorem nawet. W farmacji i pochodnych nie używa się machine learning bo nie ma po co, tylko czystej statystyki i to bardzo specjalistycznej statystyki. Python jest lepszy w machine learning, za to taka specjalistyczna statystyka w nim to zaledwie wycinek, raczej nierozwijany, kto pracował ten wie. Nie ma nawet dobrych metod do imputacji danych, tylko podstawowe. Medycy mają swoje metody statystyczne, których w Pythonie po prostu brak, a tych ledwie parę co są to na żenującym poziomie. I to zrozumiałe. Bo niby po co je rozwijać, kto miały to robić? Komu mogą być potrzebne, to siedzi w SAS albo R. A ci, co im to niepotrzebne, i tak nie wiedzą gdzie szukać wiedzy na ten temat i nie mają zamiaru tracić czasu. Pythoniści zachłysnęli się big data i machine learning, więc tutaj rozwijają jego możliwości. I tutaj Python jest mega. Ale big kasa to nie tylko big data, a tam potrzeba statystyki, i tam Python raczej nie podskoczy, bo kuleje i to mocno. Myślę, że oba języki po prostu się podzieliły rynkiem. O ile jeszcze flame między javą a c# ma rację bytu, bo ich domeny się w 100% nakładają, to tutaj nie ma to sensu, bo oba środowiska służą do czego innego. Dla przeciętnego eRowca kod w Pythonie jest nieczytelny. Dla Pythonisty kod w R to rzeźnia. Obserwacja na podstawie kilku roczników studentów i kilkudziesięciu konferencji z naukowcami programistami R, którzy zobaczyli ten sam kod w Pythonie i ręce im opadły. Dla programisty to nie problem, bo programista zrozumie kod w każdym, nawet nieznanym sobie języku, przez analogię. Dla naukowca to ma wielkie znaczenie, bo on uczy się konkretnego narzędzia. O ile test t Studenta można odpalić w obu środowiskach, to już bardziej zaawansowana statystyka dziedzinowa w Pythonie to parodia. Za to np. tworzenie GUI w Pythonie jest przyjemne, a w R uciążliwe, w GTK albo Tcl/Tk. Swoją drogą to R wszedł do MS SQL Servera i PowerBI i to w niego Microsoft zainwestował w 2016 i 2017, nie mówiąc o Oracle, które wypuściło R Enterprise. Ale i Pythonem MS się podobno interesuje, więc może oba języki będą wspierane przez jego narzędzia analityczne.

edytowany 1x, ostatnio: Admirał Jahaś, 2017-05-22 20:48
GUI bardzo latwo robić w r dzięki shiny. No python jest dla mnie nieczytelny... brakuje klamr. A jakos java czy c++ jest czytelny. Podsumowujac: r najepszy - Julian_ 2017-05-22 22:02
Ale to już frontend webowy. Shiny na localhoście w trybie single user jest OK. Do bardziej złożonych rzeczy używam jednak ASP.NET na localhoście pod serwerkiem Cassini (używam ASP.NET 3.5) + webserwis w R postawiony na OpenCPU. Jeśli chodzi o desktopowe GUI, to do małych rzeczy gWidgets nadaje się w miarę OK, do większych lepsze czyste RGTK, a do dużych - Java albo .NET i konektor i odpowiedni konektor do R, np. R.NET. - Admirał Jahaś 2017-05-22 22:33

Pozostało 580 znaków

Odpowiedz
Liczba odpowiedzi na stronę

1 użytkowników online, w tym zalogowanych: 0, gości: 1, botów: 0