Jak usunąć znaki Unicode z frazy łańcuchowej Pythona? [duplikować]

Dec 22 2020

Mam problem, a to że mam zdanie, które zawiera to :

Debes modificar la dieta que est \ xc3 \ xa1 s Consumiendo, para que te sientas con m \ xc3 \ xa1 s energ \ xc3 \ xad ay vitalidad, mejorando tu calidad de vida de una forma extraordinaria. Si no sabes por donde empezar, busca ayuda en un nutricionista que te guie en este cambio tan beneficioso para tu organismo.

i chcę się zmienić

  • \ xc3 \ xa1 -> á
  • \ xc3 \ xad -> í

Próbowałem zamienić w pythonie, ale to nie działa.

Co powinienem zrobić?

Odpowiedzi

Dunski Dec 22 2020 at 16:24

To działa...

b'\xc3\xa1'.decode("utf-8")
b'\xc3\xad'.decode("utf-8")

Aby dodać to do swojego skryptu, możesz dodać te linie do swojego skryptu po poleceniu zamiany.

salud_list = salud.split(' ')

for word in salud_list:
    if isinstance(word,bytes):
        word = word.decode("utf-8")

print(' '.join(salud_list))