Jakie są fazy preprocessingu danych najbardziej rozszerzonej klasyfikacji oraz jakie biblioteki Pythone są wykorzystywane w wich poszczególnych fazach?
0
0
Mógłbyś wytłumaczyć po polsku o co chodzi?
0
Domyślam się, że chodzi o przetwarzanie w ramach Data Science.
Zgodnie z CRISP-DM jest kilka faz:
- Business Understanding
- Data Understanding
- Data Preparation
- Modeling
- Evaluation
- Deployment
Bibliotek pythonowe: matplotlib, seaborn, scikit-learn, pandas , numpy, ... jest tego masa.
Szukaj pod hasłem CRSIP-DM data preparation -> np. https://www.ibm.com/docs/it/SS3RA7_18.3.0/pdf/ModelerCRISPDM.pdf
0
Najprościej: bronze -> silver -> gold czyli tzw medalion architecture (databricks).
Od surowych danych po agregacje / relacje.