Witam,
Jestem poczatkujacym programista, zrobilem narzedzie ktore polyka dane wejsciowe, robi na nich okreslone operacje po czym zrzuca na koniec wynik do pliku.
Zrobilem to na zasadzie wczytania danych wejsciowych jako obiektow, jedno zadanie = 1 obiekt, sa one wczytywane na 'kolejke' LinkedBlockingQueue (poniewaz workerów obrabiajacych dane jest wiele i pobieraja z tej kolejki kolejne elementy, obrobka 1 elementu trwa ok 1-5sek poniewaz odbywa sie przez siec/zewn API) po czym po otrzymaniu odpowiedzi z serwera wrzuca dany obiekt usupelniony o brakujace wartosci na kolejkę wyjsciową (tez LinkedBlockingQueue).
danych do obróbki moze byc czasami duzo np 15tyś, więc po uruchomieniu programu tworzone jest 15tys obiektow (kazdy ma kilka pól typu String oraz int wiec nic wielkiego), są one obrabiane i zrzucane do pliku z kolejki wyjsciowej.
Otóż kolega ktory z Javą nie ma doczynienia, ale programuje w Pythonie (nie znam jego punktu widzenia bo nie programowalem w pythonie) caly czas twierdzi ze nie powinienem przechowywac tyle danych w pamieci, tylko w bazie danych. Wiem jak to zrobić, tj wczytac wszystko do bazy danych np postgres, pozniej pojedynczo kazdy worker by zczytywal pojedyncze dane po czym je uzupelnial, a na koniec wygenerowac plik wynikowy z bazy danych, ale moje pytanie brzmi: czy ma to większy sens?
Czy faktycznie nie powinienem przechowywac tych obiektow w pamieci tylko w bazie danych? Czy zwiekszy, badz zmniejszy to wydajnosc?
O bezpieczenstwo danych się nie martwie bo i tam mam proces ktory zrzuca plik wynikowy co okreslony czas, zeby w razie jakiegos nieoczekiwanego wywalenia móc kontynuowac dalej itd.
Szukam w internecie jakis poradnikow.dobrych praktyk w tym temacie ale z marnym skutkiem.
Dzieki za ew podpowiedzi :)