Comment supprimer les caractères Unicode de la phrase de chaîne python? [dupliquer]
Dec 22 2020
J'ai un problème, et c'est que j'ai une phrase qui contient ceci :
Debes modificar la dieta que est \ xc3 \ xa1 s consumiendo, pour que te sientas con m \ xc3 \ xa1 s energy \ xc3 \ xad ay vitalidad, mejorando tu calidad of vida de una forma extraordinaria. Si no sabes por donde empezar, busca ayuda en un nutricionista que te guie en este cambio tan benefoso para tu organismo.
et je veux transformer
- \ xc3 \ xa1 -> á
- \ xc3 \ xad -> í
J'ai essayé de remplacer en python mais cela ne fonctionne pas.
Que devrais-je faire?
Réponses
Dunski Dec 22 2020 at 16:24
Cela marche...
b'\xc3\xa1'.decode("utf-8")
b'\xc3\xad'.decode("utf-8")

Pour l'ajouter à votre script, vous pouvez ajouter ces lignes dans votre script après vos commandes de remplacement.
salud_list = salud.split(' ')
for word in salud_list:
if isinstance(word,bytes):
word = word.decode("utf-8")
print(' '.join(salud_list))