Algorytm do klasyfikacji tekstów.

0

Witam,

Myślę nad ulepszeniem w/w programu, obecnie klasyfikacja działa na zasadzie wyszukiwania kluczowych słów/wyrażeń (String).

Czy znacie jakiś w miarę prosty w implementacji algorytm, którego można użyć do klasyfikacji tekstu?

Pozdrawiam

0

Chodzi ci o klasyfikację tekstów na zasadzie przynależenia tekstu do jakiejś kategorii tematycznej? To sie nazywa TopicModellig i masz trochę algorytmów do tego, najpopularniejsze są LSI oraz LDA.
Ale miej na uwadze że praktycznie każdy tekst przynależy jednocześnie do wielu kategorii (te algorytmy zwracają ci oprócz numeru tematu także % przynależności).
Jako jeden z projektów pisałem niedawno algorytm i aplikację która służy do oznaczania który fragment tekstu dotyczy danego tematu.

0

Witam,

znacie może jakiś przykład trywialny w/w, ewentualnie innych algorytmów?

Pozdrawiam

0

Jak chcesz prosty przykład jakiegoś algorytmu to może cosine similarity? On jest prosty jak budowa cepa :)

0

Witam,

Shalom napisał(a):

Jak chcesz prosty przykład jakiegoś algorytmu to może cosine similarity? On jest prosty jak budowa cepa :)

Dzięki raz jeszcze, na razie udała mi się wstępna implementacja.

Jeżeli mógłbyś podrzucić jeszcze jakiś algorytm to byłbym wdzięczny.

Pozdrawiam

1 użytkowników online, w tym zalogowanych: 0, gości: 1