Cómo buscar como palabra de una cadena en Python usando expresiones regulares [duplicar]

Nov 25 2020

Tengo una cuerda como

string = "Status\t\t: PASS"

Quiero obtener solo PASS de esta cadena y estoy usando esta expresión regular.

value = re.findall("Status" + r'(.*)', string)

Pero me devuelve esto

"           : PASS"

Quiero que la expresión regular ignore todos los caracteres adicionales, espacios, pestañas, etc. Por favor, avíseme cómo puedo hacer esto.

Respuestas

3 VivekKumar Nov 25 2020 at 13:36

Método: Usando regex () + string.punctuation Este método también usó expresiones regulares, pero la función de cadena de obtener todas las puntuaciones se usa para ignorar todos los signos de puntuación y obtener la cadena de resultado filtrada.

# Python3 code to demonstrate 
# to extract words from string 
# using regex() + string.punctuation 
import re 
import string 

# initializing string 
test_string = "Geeksforgeeks, is best @# Computer Science Portal.!!!"

# printing original string 
print ("The original string is : " + test_string) 

# using regex() + string.punctuation 
# to extract words from string 
res = re.sub('['+string.punctuation+']', '', test_string).split() 

# printing result 
print ("The list of words is : " + str(res)) 

Salida:

The original string is : Geeksforgeeks, is best @# Computer Science Portal.!!!
The list of words is : [‘Geeksforgeeks’, ‘is’, ‘best’, ‘Computer’, ‘Science’, ‘Portal’] 
2 tshiono Nov 25 2020 at 14:25

¿Podría intentar lo siguiente?

import re
string = "Status\t\t: PASS"
m = re.search(r'Status\s*:\s*(.*)', string)
print(m.group(1))

Salida:

PASS

Explicación de la expresión regular Status\s*:\s*(.*):

  • Status\s* coincide con la subcadena "Estado" y los siguientes caracteres en blanco tanto como sea posible, si los hay.
  • :\s* coincide con un carácter ":" y los siguientes caracteres en blanco tantos como sea posible, si los hay.
  • (.*) coincide con la subcadena restante y se le asigna el grupo de captura 1.
1 Heo Nov 25 2020 at 14:23

Prueba esto: regex-demo

Fuente de Python:

import re

input1 = "Status\t\t: PASS"
input2 = "Status\t\t: PASS hello"
input3 = "Status\t\t: FAIL hello world"
regex=re.compile('status\s*:\s*(\w+)',flags=re.IGNORECASE)

print(f'result of input1: \n {regex.findall(input1)}')
print(f'result of input2: \n {regex.findall(input2)}')
print(f'result of input3: \n {regex.findall(input3)}')

Salida:

result of input1: 
 ['PASS']
result of input2: 
 ['PASS']
result of input3: 
 ['FAIL']