Pythonの文字列フレーズからUnicode文字を削除するにはどうすればよいですか?[複製]

Dec 22 2020

私は問題を抱えています、そしてそれは私がこれを含む文を持っているということです:

Debes modificar la Dieta que est \ xc3 \ xa1 s consumiendo、para que te sientas con m \ xc3 \ xa1 s energ \ xc3 \ xad ay Vitalidad、mejorando tu calidad de vida de una formaextraordinaria。Si no sabes por donde empezar、busca ayuda en un nutricionista que te guie en este cambio tan beneficioso paratuorganismo。

そして私は変身したい

  • \ xc3 \ xa1->á
  • \ xc3 \ xad->í

Pythonで置き換えようとしましたが、機能しません。

私は何をすべきか?

回答

Dunski Dec 22 2020 at 16:24

これは動作します...

b'\xc3\xa1'.decode("utf-8")
b'\xc3\xad'.decode("utf-8")

これをスクリプトに追加するには、replaceコマンドの後にこれらの行をスクリプトに追加します。

salud_list = salud.split(' ')

for word in salud_list:
    if isinstance(word,bytes):
        word = word.decode("utf-8")

print(' '.join(salud_list))