Rozpoznawanie kodowania tekstu

0

Witam.
Od jakiegoś czasu piszę klienta sieci IRC no i dzisiaj okazało się, że program ma problem z kodowaniem, a dokładniej o to w jakim kodowaniu dostaję tekst.
Problem polega na tym, że jeżeli w programie mam ustawione kodowanie utf8 to to co przychodzi (tekst) do mojego programu też jest "odkodowywane" na CP właśnie przez funkcję od utf8, ale gdy tekst przychodzący to nie utf8 tylko np. ISO to wtedy zamiast
"ąą" dostane "?". Więc pomyślałem, że aby ominąć ten problem muszę rozpoznawać kodowanie tekstu. I tu jest pytanie jak to zrobić?

Aha. Pisze pod Windę :) Bo w linuksach chyba jest cos takiego jak iconv (ale ja sie na linuksach nie znam więc się nie wypowiadam :) )

0

Jeśli nie ma znaczników, ani nie da się odpytać przez polączenie to pozostaje metoda zliczania znaków.
Większość stron kodowych ma specyficzne znaki - inaczej jest ą reprezentowane itd. Można sprawdzać czy specyficzne znaki występują, przy przewadze znaków typowych dla konkretnego kodowania można z dużym prawdopodobieństwem przyjąć że to właśnie to kodowanie. W przypadku krótkich tekstów jest to utrudnione, bo większe ryzyko błędu

1 użytkowników online, w tym zalogowanych: 0, gości: 1