Usuwanie niechcianych znaków - autokorekta

0

Nie ważne kto co i jak, nie jestem za to odpowiedzialny, ale ktoś przy zrzucie danych wybrał złe formatowanie później jakoś przkopiował itd. Ogólnie problem jest w tym, że polskie znaki zastąpione są '??'. Nie jest to wina kodowania, tam są na sztywno wpisane te znaki zapytania. Czy istnieje jakiś program który porówna wyrazy z polskimi wyrazami i zamieni na prawdziwe.

Przykład:

Rywalizacja by??a zacięta i wyr??wnana, a zwycięzcami zostali przedstawiciele klas pierwszych z Liceum Og??lnokszta??c??cego w Wa??czu. Gratulujemy!

wiadomo, że 100% nie naprawi ale dużą część. Zostaną słowa, które maja kilka wersji np. 'idę' i 'idą'.

dodanie znacznika <quote> - @furious programming

0

Hmm.. osobiście nie znam. Ale to fajny przypadek do poćwiczenia. Wczytać słowo, znormalizować litery wielkie/małe, zamienić znaki zapytania na znaki klasy znaków polskich w wyrażeniu regularnym, porównać z wzorcami w słowniku. Nie jest takie trudne :-) A i tak takie podejście siłowe powinno wystarczyć jeśli to ma być program 1 użyty.

0

Jest możliwość napisania programu, który porówna słowa z błędem do słów z jakiegoś słownika. Ale ciekawy jestem czy jest coś takiego. Istnieją aplikacje jak LanguageTool, który wyszukuje i proponuje dość trafna korektę, ale tylko wskazuje a nie edytuje tekstu. Poszperam jeszcze w przeciwnym wypadku trzeba będzie coś napisać :)

1 użytkowników online, w tym zalogowanych: 0, gości: 1