Text Mining, analiza sentymentalna i webservice w Javie

0

Chcę zrobić automat do pobierania wpisów na pewnych stronkach. Te wpisy chciałbym zapisywać (chyba najlepiej w hurtownii danych?) po to by służyły do zbudowania modelu analizy sentymentalnej.
Ten automat powinien być osadzony na stronie internetowej jako web service i wywoływany na kliknięcie. Wywoływany w sensie - kliknięcie uruchamia pobieranie aktualnych danych ze stronek oraz zwraca pewne wartości wg modelu analizy sentymentalnej.
Model analizy sentymentalnej na wejściu bierze najbardziej dostępne aktualne (np. ostatni dzień od ostatniej aktualizcji) wpisy, wylicza coś tam i zwraca pewne wartości.

W R zrobiłbym to za pomocą Shiny z MySQL - bardzo prosto i za free.

Pytanie jak to zrobić w Javie: czego będę potrzebował poza eclipse i MySQL?

1

Analiza sentymentu, jeśli już musisz użyć polskiego słowa ;)
Nie do końca rozumiem o którą cześć pytasz. Do pobierania danych potrzeujesz jakiegoś crawlera, wiec możesz użyć czegoś w stylu crawler4j jeśli nie chcesz pisać wszystkiego od zera.
Dalej sporo zależy od tego z jakim językiem pracujesz. Dla angielskiego jest trochę tooli ze Stanforda do NLP, ale jeśli to ma być język polski to czeka cię trochę wiecej pracy, bo trzeba dane najpierw odpowiednio znormalizować (lematyzacja/stemming) a sam model analizy sentymentu raczej będziesz musiał napisać samodzielnie.

0

Model zrobię sobie w R i reguły potem zaimplementuję w Javie.
Bardziej się głowię nad tym jak zrobić tę aplikację Javową... i jak to skonfigurować by działało jako web service.
Do interfejsu użyć Swinga?

0

Co ma Swing do weba? o_O

0

Nie wiem, to jedyne co znam co pozwala narysować interfejs.

0

Ale jaki interfejs? Pisałeś że chcesz to osadzić na jakiejś stronie web przecież? Zresztą to są szczegóły, skup sie najpierw na crawlowaniu i liczeniu.

0

chcę mieć aplikację wyglądającą mniej w takim stylu:

https://shiny.rstudio.com/gallery/word-cloud.html

Wchodzisz na stronę i widzisz okienko z taką aplikacją.

1 użytkowników online, w tym zalogowanych: 0, gości: 1