Como faço para usar REGEXTRACT no Planilhas Google para isolar o GCLID?

Aug 18 2020

Sou um profissional de marketing e o Google atribui aos cliques um Google Click ID (GCLID) no tráfego pago. Eles vêm anexados a URLs. Às vezes, preciso isolar o valor em uma planilha do Google usando REGEX.

Aqui está o que fiz para extrair o GCLID em Sublime Text, mas não está produzindo o resultado esperado em planilhas do Google:

(?<=gclid=).*?[?=A-Za-z0-9\-\_]{10,100}

100 caracteres alfanuméricos com distinção entre maiúsculas e minúsculas é o máximo para esses IDs. Eles também consistem em "-" e "_".

Acredito que este seja um uso eficaz de um lookback positivo REGEX que produz apenas o GCLID no final da consulta de URL.

O uso de um ?no Planilhas Google parece quebrar a expressão.

Respostas

1 WiktorStribiżew Aug 18 2020 at 16:07

Você pode usar

=REGEXEXTRACT(A1, "gclid=([\w-]+)")

Observe que a REGEXEXTRACTfunção só retorna a (s) substring (s) capturada (s) se o (s) grupo (s) de captura estiverem definidos na expressão regular.

O regex corresponde

  • gclid= - uma string literal
  • ([\w-]+)- Grupo de captura 1: qualquer uma ou mais letras, dígitos _ou -(observe que o -no final de uma classe de caractere não precisa ter escape para ser analisado como um hífen literal).