Liczenie słów w bazie danych za pomocą SQL

0

Witam,
zastanawiam się czy SQL umiałby poradzić sobie z zadaniem:

policz wszystkie słowa w bazie danych prócz słów zawartych w <...>

np:

aa bb cc <dd>słowa słowa</dd> ee

poprawny wynik to: 4

np 2:

aa! (link: ddd) <dd>słowa słowa</dd> 

poprawny wynik to: 7 (wliczamy także znaki specjalne, itd)

0

Potrafię sobie wyobrazić mniej więcej coś takiego.
Bazy mają funkcje operujące na stringach, zależnie z jakiej bazy korzystać te funkcje będą się różnić.
Jak aj to widzę:

  1. wyznaczasz na jakiej pozycji jest <dd> oraz <dd /> (w drugim przypadku przesuwasz tak żeby policzyć koniec)
  2. podajesz te indexy i wycinasz tekst pomiędzy tymi tagami (substring)
  3. znajdujesz separator i dzielisz na słowa (split)
    Ale to tak bardzo abstrakcyjnie bez konkretów :)
0

znaczników jest kilkatysięcy. cała baza będzie miała kilka milionów słów...
nie ma szans robić tego ręcznie.

czy lepiej sobie eksportować i dopiero działać?

0

stored proc do tego i da radę to zrobić. Jedynie trzeba zmodyfikować 1 pkt z postu @szarotka tak aby wycinać wszystko pomiędzy < a />, biorąc pod uwagę, że w jednym rekordzie może być kilka znaczników.

1 użytkowników online, w tym zalogowanych: 0, gości: 1