Expressões regulares (regex) são mini-linguagens para descrever padrões em strings: encontrar, capturar ou substituir trechos sem escrever laços manuais extensos.

Blocos de construção

  • Literaisfoo casa exatamente foo.
  • Metacaracteres. (qualquer caractere), \d dígito, \s espaço em branco, + uma ou mais, * zero ou mais, ? opcional.
  • Classes[A-Z0-9] lista permitida; [^,]+ nega vírgula e exige comprimento mínimo 1.
  • Âncoras^ início de linha, $ fim (modo multiline importa).
  • Grupos(https?) captura http ou https para referência posterior.

Modo preguiçoso vs ganancioso

Quantificadores podem consumir mais do que você imagina; .*? costuma ser o ajuste preguiçoso em engines que suportam.

Quando regex não basta

  • HTML/XML arbitrário — use parser DOM/XML dedicado.
  • E-mails “perfeitos” — validação completa é estado máquina, não um único regex curto.

Ferramenta relacionada

Aplique regex opcional para filtrar linhas antes de deduplicar ou normalizar espaços.