AUtomatyczna korekta błędów

0

Witam,

Mam nietypowy problem. Mianowicie potrzebuje napisać program poprawiający błędy ortograficzne. (literówki przestawienia liter itd.) Sprawa może nie była by tak bardzo skomplikowana gdyby nie fakt że muszę do tego wykorzystać automat skończenie stanowy.

Teraz pytanie o jakiś sensowny algorytm który mógłby w tym pomóc ?
(Standardowo bym policzył odległość lewensteina dla słów w słowniku i zwrócił jako propozycje korekty te z odległością jeden)

Z dodatkowych informacji muszę używać openfst (jezeli to cokolwiek zmienia)

Pozdrawiam

0

gdyby chodziło tylko o ortografie typu "rż", to bym powiedział: zapoznaj się z regułami ortografii i dla każdej zbuduj odpowiednią cząstkę automatu, np. po bdgptkwj[ch] piszemy rz, pamiętaj o wyjątkach, ale jak ma badać też przestawienia, to sprawa jest trudniejsza...

może dla zadanego słowa (do poprawy) zbuduj automat jakoś tak, żeby ewentualne translacje prowadzące nasz wyraz do postaci będącej w słowniku dawało krótszą drogę, niż do postaci nie będącej w słowniku...

0

Drzewo trie, odległość (Damerau-)Levenshteina, etc.

1 użytkowników online, w tym zalogowanych: 0, gości: 1