Mając przykładowe dane:
EEEEEEEEEEEEEEEFFFFFFFFFFFFFFFFF888888888888888886444444444444444442222222222222
222288888888888888888444444444444444EEEEEEEEEEEEEEEEEFFFFFFFFFFFFFFFFF8888888888
8888888844444444444444444FFFFFFFFFFFFFFFFF4444444444444444422222222222222201842859183F4
można je zinterpretować jako zbiór podciągów stałych:
EEEEEEEEEEEEEEE FFFFFFF1FFFFFFFFF 88888688888886886 44444444444444444 22222222222222222 88888888888888888 444444444444444 EEEEEEEEEEEEEEEEE FFFFFFFFFFFFFFFFF 888888888888888888 44444444444444444 FFFFFFFFFFFFFFFFF 44444444444444444 222222222222222 01842859183F4
Podciągi mają różne długości, mogą być "zaszumione" (przykłady pogrubione). Przykład pochylony ma zostać wyeliminowany jako próbka całkowicie zaszumiona.
Algorytm ma wybrać z tych danych podciągów litery dominujące, przy czym ma nie brać próbek całkowicie zaszumionych pod uwagę. Z powyższego przykładu ma zostać wygenerowany ciąg:
EF84284EF84F42
Czy istnieje algorytm pozwalający na taką operację?