Ostatnio coraz częściej spotykam się z pojęciem Big Data, chciałbym nieco zgłębić temat w praktyce. Niestety z braku doświadczenia nie do końca wiem jaki sensowny projekt mógłby wykonać.
Co chciałbym wykorzystać w projekcie:
- Apache Cassandra - http://cassandra.apache.org/
- Disco - http://discoproject.org/
- API jakiegoś serwisu społecznościowego (Twitter, Facebook, Instagram) - jako źródło danych
Pierwsze co przychodzi mi do głowy to stworzenie jakichś statystyk albo analizy (sentymentu etc.)
Czy ktoś zajmujący się przetwarzaniem dużych ilości danych byłby w stanie mnie nieco nakierować? Zależy mi na tym żeby wykorzystać wspomniane narzędzia w sposób właściwy a nie tylko je zaimplementować żeby coś tam zadziałało.