Witam wszystkich, mam bazę tekstów (kilkadziesiąt tysięcy, w odległej przyszłości może kilkaset), które chciałbym efektywnie przeszukiwać.
Wstępne założenia:
- wyszukiwana fraza będzie zwracana w kontekście tzn wraz z jakimś fragmentem tekstu otaczającego, co pociąga za sobą pewne konsekwencje - jeśli np. w całej bazie wystąpi tylko w jednym rekordzie, ale X razy, to będzie X wyników (a przynajmniej X kontekstów w ramach jednego wyniku),
- sortowanie wyników - najlepiej gdyby teksty z największą ilością wystąpień były najwyżej,
- traktowanie fraz wielowyrazowych najpierw jako jeden ciąg, a potem przeszukiwanie bazy pod kątem każdej frazy osobno,
- odmianę na razie odpuszczam.
Zanim zacznę pisać coś od zera, może macie jakieś wskazówki, doświadczenia z gotowymi bibliotekami? Na ten moment teksty zgromadzone są w MariaDB, chociaż liczę się z tym, że konieczne będzie przerzucenie tego do Postgresa...
Z góry dziękuję za wszelkie podpowiedzi. Pozdrawiam.