Krzaki, czyli unicode w pythonie 3

0

Ściągam dane ze strony, która deklaruje że jej kod jest w utf-8. Tekst ze strony jest OK. Tylko wybrane liczby (konkretnie ceny produktów) są w postaci 3? 454,00 z? zamiast 3 454,00 zł.

Nie bardzo wiem, jak sobie z tym poradzić.

Używając encode/ decode nic nie pomogło. Kod tego niepożądanego znaku to \xa0 (ZTCP).

Używam Pythona 3.4

Co poradzicie?

0

Jeszcze dodam:

  • próbowałem z

nz = nazwa_zmiennej.replace("\xa0", " ")
(nazwa_zmiennej to string)

Jak pozbyć się znaków innych niż alfanumeryczne?

strip, rstrip i lstrip usuwają tylko "białe znaki" z tego co próbowałem, i tylko z końców stringa.

0

Możesz zrobić:

fixed = unicodedata.normalize("NFKD", line)
fixed = fixed.encode('ascii', 'ignore')

1 użytkowników online, w tym zalogowanych: 0, gości: 1