Cześć. Potrzebuję coś napisać w Pythonie w którym mam zerowe doświadczenie (od ponad 10 lat programuję w C# i trochę Java) i potrzebuję porady jakich bibliotek/narzędzi Pythonowych użyć do mojego problemu. Mianowicie potrzebuję zrobić taki background job który sobie chodzi w tle i robi coś takiego:
- Pobiera dane z systemu A poprzez API/bazę danych/odczyt pliku cokolwiek ten system udostępnia.
- Robi prostą transformację/mapowanie danych, może też jakieś proste obliczenia/agregacje danych.
- Rezultat zapisywany jest w systemie B wykorzystując HTTP API tego systemu.
To na czym mi najbardziej zależy to aby te reguły transformacji/mapowania można było definiować w osobnym pliku z konfiguracją (JSON, YAML, Excel też może być...). Tak więc kod tego joba nie powinien mieć wiedzy o regułach mapowania, przez co można je modyfikować bez konieczności dłubania w kodzie.
Mamy więc tu taki proces ETL, ale z racji skali wykorzystania tego narzędzia nie chcę korzystać z narzędzi firm trzecich w stylu Airflow, AWS Glue czy Azure Data Factory. Pisać tego wszystkiego samemu też nie chcę (choć bym mógł i w ostateczności jak nie ma narzędzi do tego to będę musiał tak zrobić).