Próbuję zrozumieć na czym polega Shannon–Fano–Elias coding i arithemtic coding. Pierwszy raz spotykam się z algorytmami kompresji danych i mam pytanie o podstawy.
Mówimy tam o prawdopodobieństwach. Co to są właściwie za prawdopodobieństwa? Wystąpienia jakichś liter, ciągów, znaków? Skąd znamy te prawdopodobieństwa? Częstość występowania liter w danym języku, rozkład Benforda? Czy w praktyce bierzemy ciągi binarne odpowiadające literom alfabetu i próbujemy je skompresować - zamienić na krótsze? A może określa się prawdopodobieństwo dla dłuższych ciągów, dla całych słów?