Fazy i biblioteki Python preprocessingu danych

0

Jakie są fazy preprocessingu danych najbardziej rozszerzonej klasyfikacji oraz jakie biblioteki Pythone są wykorzystywane w wich poszczególnych fazach?

0

Mógłbyś wytłumaczyć po polsku o co chodzi?

0

Domyślam się, że chodzi o przetwarzanie w ramach Data Science.

Zgodnie z CRISP-DM jest kilka faz:

  • Business Understanding
  • Data Understanding
  • Data Preparation
  • Modeling
  • Evaluation
  • Deployment

Bibliotek pythonowe: matplotlib, seaborn, scikit-learn, pandas , numpy, ... jest tego masa.

Szukaj pod hasłem CRSIP-DM data preparation -> np. https://www.ibm.com/docs/it/SS3RA7_18.3.0/pdf/ModelerCRISPDM.pdf

0

Najprościej: bronze -> silver -> gold czyli tzw medalion architecture (databricks).
Od surowych danych po agregacje / relacje.

https://www.databricks.com/glossary/medallion-architecture

1 użytkowników online, w tym zalogowanych: 0, gości: 1