Jupyter, Zeppelin, inne w produkcyjnych zastosowaniach

0

Używa ktoś produkcyjnie, któregoś z wymienionych (lub innych) notebooków do analizy danych i publikowania rezultatów dla klienta?
Interesuje mnie jak klient zareagował na taką technologię i aspekty wdrożeniowe (w szczególności security). Ktoś coś?

1

Ja używam Jupytera do tworzenia pipeline'ów przetwarzania i analizy danych dla klientów, w których łączę np. Pythona z R i Julią. Dotyczy to jednak głównie zastosowań naukowych dla sektora akademickiego i komercyjnych dla sektora prywatnego. Nie wiem jak odpowiedzieć na pytanie o bezpieczeństwo takiego rozwiązania. Ogólnie dane są udostępniane przez klienta, a ja tworzę pipeline, po czym wysyłam gotowy notebook zawierający analizy oraz komplementarny opis wymaganych zależności i przeprowadzanych operacji wraz z interpretacją wyników w markdownie. Obowiązuje mnie oczywiście zakaz udostępniania danych innym podmiotom etc.

0

Jeśli chodzi o bezpieczeństwo, to mam na myśli:

  • ograniczenie dostępu do notebooków dla użytkowników zalogowanych/określonych ról (userA ma dostęp do Notebook1,3,5, userB do notebook2,4,6 itp.)
  • brak loginów/haseł w notebookach

Używasz jednej instancji dla wszystkich klientów, czy może osobne instancje?

Inne kwestie, to uwiecznianie notebooków (lokalny system plików, czy może coś innego?) i ich wersjonowanie? Git, inne, brak wersjonowania?

1
  1. Dane od klientów trzymam lokalnie na zewnętrznym nośniku (serwer), po czym usuwam je po zakończeniu współpracy.
  2. Pracuję sam, więc nie mam potrzeby zabezpieczania hasłami indywidualnych notebooków.
  3. Dla każdego projektu tworzę oddzielną instancję.
  4. Gdy projekt jest w trakcie realizacji i wymaga kilku iteracji ja-klient, to korzystam z lokalnego GITa do kontroli wersji. Jeżeli projekt nie wymaga iteracji, to z GITa nie korzystam.
  5. Gotowe notebooki trzymam lokalnie na zewnętrznym nośniku (serwer) przez określony czas.

1 użytkowników online, w tym zalogowanych: 0, gości: 1