Expressões regulares (regex) são mini-linguagens para descrever padrões em strings: encontrar, capturar ou substituir trechos sem escrever laços manuais extensos.
Blocos de construção
- Literais —
foocasa exatamente foo. - Metacaracteres —
.(qualquer caractere),\ddígito,\sespaço em branco,+uma ou mais,*zero ou mais,?opcional. - Classes —
[A-Z0-9]lista permitida;[^,]+nega vírgula e exige comprimento mínimo 1. - Âncoras —
^início de linha,$fim (modo multiline importa). - Grupos —
(https?)captura http ou https para referência posterior.
Modo preguiçoso vs ganancioso
Quantificadores podem consumir mais do que você imagina; .*? costuma ser o ajuste preguiçoso em engines que suportam.
Quando regex não basta
- HTML/XML arbitrário — use parser DOM/XML dedicado.
- E-mails “perfeitos” — validação completa é estado máquina, não um único regex curto.
Ferramenta relacionada
Abrir removedor de espaços e linhas duplicadas no Cod3x Tools
Aplique regex opcional para filtrar linhas antes de deduplicar ou normalizar espaços.