Expresiile regulate (regex sau regexp) sunt modele puternice utilizate pentru a se potrivi, căuta și manipula text. Ele sunt suportate în practic fiecare limbaj de programare, inclusiv JavaScript, Python, Java, PHP și altele. De la validarea adreselor de email până la analizarea fișierelor de jurnal, regex este o abilitate indispensabilă pentru orice dezvoltator.
Sintaxa Comună a Regex
Elementele cheie ale regex includ: \d (cifre), \w (caractere de cuvânt), \s (spațiu alb), . (orice caracter), * (zero sau mai multe), + (unu sau mai multe), ? (opțional), [] (clase de caractere), () (grupuri), ^ (început) și $ (sfârșit). Combină aceste blocuri de construcție pentru a crea modele care se potrivesc exact textului de care ai nevoie. De exemplu, \b\w+@\w+\.\w+\b se potrivește cu modele simple asemănătoare adreselor de email.
Sfaturi pentru Scrierea unui Regex Mai Bun
Începe simplu și construiește complexitatea. Testează frecvent cu date reale de exemplu. Folosește cuantificatori non-greedy (*? și +?) atunci când vrei cea mai scurtă potrivire posibilă. Folosește grupuri numite (?...) pentru lizibilitate. Evită backtracking-ul catastrofal fiind specific cu modelele tale — folosește clase de caractere [] în loc de . atunci când este posibil și ancorează modelele tale cu ^ și $ atunci când este adecvat.