Szukanie tekstu z uwzg. form gramat.

0

Przykładowo:

gość wpisuje tekst do wyszukania: 'szybki samochód',

teraz program powinien znaleźć wszystkie inne formy:

'szybkich samochodów', 'szybkiego rajdu samochodowego', itd.

Ma ktoś coś takiego pod ręką? :-)

0

Przede wszystkim chodzi mi o to czy taki algorytm wyszukujący
będzie musiał korzystać z potężnego słownika, w którym słowa
będą podzielone na czasowniki, rzeczowniki, przymiotniki... + rodzaj.

A może wystarczy tylko lista końcówek?

Weźmy takie hasło: "kombinowanie",
można tu oddzielić końcowe -owanie i szukamy 'kombin',
znajdziemy: 'kombinowany', 'kombinacja', 'kombinat' - chyba OK!

hasło: 'szczerego',
oddzielamy -ego i szukamy 'szczer'

hasło: 'rotacja',
chyba trzeba oddzielić -acja i szukamy 'rot',
znajdziemy: 'rotor', 'rotunda' ?, 'rota' ?

hasło: 'koszula',
oddzielmy -ula szukamy 'kosz',
znajdziemy: 'kosz', 'koszykówka', 'koszarowy', 'koszerny' :-) [???]

może tylko -la, i szukamy 'koszu' -> 'koszulowy', 'koszule'... -> OK!
:-)

0
kombin*
	kombinezon kombinator kombinatoryką kombinerkował

szczer*
	szczerbiec szczerbaty 
	szczerzyli szczerbinkę szczerby

rot*
	rotmistrz rotarianin rotterdamski rottweilerkiem rotował rotograwiurę

kosz*
	koszt kosztownego kosza, 
	koszty koszarowania koszmarnie kosztowały
	koszęciński koszularz kosztował kosztele
	koszalinianin kosztorysował

koszu*
	koszularka koszularza koszulinką

	
0

Wystarczy że zmieniona końcówka pozostanie końcówką...

rotmistrz - mistrz nie jest końcówką,
tweilerkiem - też nie

kombinezon, kombinator, kombinatoryką, kombinerkował - to wszystko jest OK,
jest wykombinowane z kombinowania... :-)

Ile takich końcówek jest w języku polskim?
Może już ktoś to analizował i jest gotowy spis...

1 użytkowników online, w tym zalogowanych: 0, gości: 1