Làm cách nào để xóa các ký tự unicode khỏi cụm từ chuỗi python? [bản sao]

Dec 22 2020

Tôi có một vấn đề, và đó là tôi có một câu chứa điều này :

Debes modificar la dieta que est \ xc3 \ xa1 sartsiendo, para que te sientas con m \ xc3 \ xa1 s energyg \ xc3 \ xad ay importantidad, mejorando tu calidad de vida de una forma extraordinaria. Si no sabes por donde empezar, busca ayuda en un Nutritioncionista que te guie en este cambio tan Beneficioso para tu organsmo.

và tôi muốn biến đổi

  • \ xc3 \ xa1 -> á
  • \ xc3 \ xad -> í

Tôi đã cố gắng thay thế bằng python nhưng nó không hoạt động.

Tôi nên làm gì?

Trả lời

Dunski Dec 22 2020 at 16:24

Những công việc này...

b'\xc3\xa1'.decode("utf-8")
b'\xc3\xad'.decode("utf-8")

Để thêm điều này vào tập lệnh của bạn, bạn có thể thêm các dòng này vào tập lệnh của mình sau các lệnh thay thế của bạn.

salud_list = salud.split(' ')

for word in salud_list:
    if isinstance(word,bytes):
        word = word.decode("utf-8")

print(' '.join(salud_list))