Odnajdywanie najczęściej występującego ciągu znaków

0

Witam, mam problem z napisaniem programu ,który ma pobierać z pliku .txt jakiś tekst i podawać najczęściej powtarzający się ciąg znaków o długości podanej przez użytkownika.

Prof. wspomniał ,że najlepiej załadować cały plik do stringa aczkolwiek nw jak poruszać się po tym ciągu znaków.

Jeśli ktoś wiedziałby jak to zrobić albo jakich użyć metod to byłbym bardzo wdzięczny za pomoc.

0

std::fstream
std::getline

0

pytania co jest rozumiane przez: "najczęściej powtarzający się ciąg znaków"?

  • sekwencja bajtów
  • ciągła sekwencja nie białych znaków np .,#1672hhis
  • ciągła sekwencja znaków alfanumerycznych np: jkskk_18272
  • ciągła sekwencja znaków literowych np: sjkksk

Do tego pytanie o

  • znaki spoza kodowania ASCII (np polskie znaki)?
  • Jak rozpatrywać ich długość (w UTF-8 jeden znak ma długość o 1 do 4 bajtów).
  • case sensitivity

Sam problem w połączaniu z std::unordered_map jest prosty do zrobienia.

0

Marek22R faktycznie nie podałem paru szczegółów;

  • plik.txt zawiera fragment książki (czyli program musi brać pod uwagę litery,cyfry, bez znaków spec.)
  • "powtarzający się ciąg znaków" (chodzi mi o to aby program na podstawie "n" liczby znaków znalazł najczęściej powtarzające się znaki w tym zakresie
    Np: ala ma kota a kot ma ale" najczęstszym ciągiem jest: dla n=3 "kot". Nie bierzemy pod uwagę spacji,wielkości liter,kropek i przecinków itp:.)

1 użytkowników online, w tym zalogowanych: 0, gości: 1