
La puissance des expressions régulières provient de leur capacité à autoriser des alternatives et des quantificateurs de répétition dans le masque. Ils sont encodés dans le masque par des métacaractères, qui ne représentent pas ce qu'ils sont, mais sont interprétés d'une certaine manière.

Il y a deux sortes de métacaractères : ceux qui sont reconnus n'importe où dans un masque, hormis entre crochets, et ceux qui sont reconnus entre crochets. À l'extérieur des crochets, les métacaractères sont :

Métacaractère en dehors des crochets
\Caractère d'échappement, avec de multiples usages
^Le début de la chaîne sujet (ou de ligne, en mode multilignes)
$La fin de la chaîne sujet ou avant la fin d'une nouvelle ligne (ou fin de ligne, en mode multilignes)
.Remplace n'importe quel caractère, hormis le caractère de nouvelle ligne (par défaut)
[Caractère de début de définition de classe
]Caractère de fin de définition de classe
|Caractère de début d'alternative
(Caractère de début de sous-masque
)Caractère de fin de sous-masque
?Étend le sens de (; quantificateur de 0 ou 1; quantificateur de minimisation (Voir les répétitions)
*Quantificateur de 0 ou plus
+Quantificateur de 1 ou plus
{Caractère de début de quantificateur minimum/maximum
}Caractère de fin de quantificateur minimum/maximum
La partie du masque qui est entourée de crochets est appelée classe de caractères. Dans les classes de caractères, les seuls métacaractères autorisés sont :
Meta-characters dans des crochets (classes de caractères)
\Caractère de protection, avec de multiples usages
^Négation de la classe, mais uniquement si placé tout au début de la classe
-Indique un intervalle de caractères
La section suivante décrit l'utilisation de chaque métacaractère.

User Contributed Notes

4 years ago
".    match any character except newline (by default)"

Here "newline" seems to include both \n (LF) and \r (CR) in PHP 7.4.6. PHP 7.3.18 seems to be more tolerant and only include \n (LF).


= "HTTP/1.1 200 OK\r\n";
if (!
preg_match('/^HTTP\/(\d\.\d)\s*(\d+).*\n/', $s, $m))
"Not matched correctly!\n";

The ".*" is supposed to match 0-n characters including \r (CR). It does so in PHP 7.3.18 but not in PHP 7.4.6.

Result (PHP 7.3.18):

Result (PHP 7.4.6):
Not matched correctly!

A pattern that works in both versions of PHP looks like this:
Kurt Wei
8 years ago
disturbing usage of "any character" for multi-lines...

'.' (all characters) just does NOT include on single character the newline (\n) by default,
while \n is included in all other matching searches (e.g. \s).
Funny enough, the "carriage return" (\r) is included, when using '.'

You have to write "(.|\\n)" instead of a single dot, with disadvantages in using complex matching-results,

or simple use the "s" modificator to bring dot to accept the newline.


preg_match( '/<tag>[A-Za-z\\s]*<\\/tag>/' , $subject ); //true
preg_match( '/<tag>[^<]*<\\/tag>/' , $subject ); //true
preg_match( '/<tag>(.|\\n)*<\\/tag>/' , $subject ); //true
preg_match( '/<tag>.*<\\/tag>/s' , $subject ); //true
preg_match( '/<tag>.*<\\/tag>/' , $subject ); //ATTENTION! *false*
6 years ago
Significantly updated version (with $pat4 and the best $pat5!):
A hint for those of you who are trying to fight off (or work around at least) the problem of matching a pattern correctly at the end ($) of any line in multiple lines mode (/m).
// Various OS-es have various end line (a.k.a line break) chars:
// - Windows uses CR+LF (\r\n);
// - Linux LF (\n);
// - OSX CR (\r).
// And that's why single dollar meta assertion ($) sometimes fails with multiline modifier (/m) mode - possible bug in PHP 5.3.8 or just a "feature"(?).
$str="ABC ABC\n\n123 123\r\ndef def\rnop nop\r\n890 890\nQRS QRS\r\r~-_ ~-_";
//          C          3                   p          0                   _
$n=preg_match_all($pat1, $str, $m1);
$o=preg_match_all($pat2, $str, $m2);
$p=preg_match_all($pat3, $str, $m3);
$r=preg_match_all($pat4, $str, $m4);
$s=preg_match_all($pat5, $str, $m5);
$str."\n1 !!! $pat1 ($n): ".print_r($m1[0], true)
"\n2 !!! $pat2 ($o): ".print_r($m2[0], true)
"\n3 !!! $pat3 ($p): ".print_r($m3[0], true)
"\n4 !!! $pat4 ($r): ".print_r($m4[0], true)
"\n5 !!! $pat5 ($s): ".print_r($m5[0], true);
// Note the difference between the three very helpful escape sequences in $pat2 (\r), $pat3 (\R), $pat4 (\v) and altered newline option in $pat5 ((*ANYCRLF)) - for some applications at least.

/* The code above results in the following output:

123 123
def def
nop nop
890 890

~-_ ~-_
1 !!! /\w$/mi (3): Array
    [0] => C
    [1] => 0
    [2] => _

2 !!! /\w\r?$/mi (5): Array
    [0] => C
    [1] => 3
    [2] => p
    [3] => 0
    [4] => _

3 !!! /\w\R?$/mi (5): Array
    [0] => C

    [1] => 3
    [2] => p
    [3] => 0
    [4] => _

4 !!! /\w\v?$/mi (5): Array
    [0] => C

    [1] => 3
    [2] => p
    [3] => 0
    [4] => _

5 !!! /(*ANYCRLF)\w$/mi (7): Array
    [0] => C
    [1] => 3
    [2] => f
    [3] => p
    [4] => 0
    [5] => S
    [6] => _
Unfortunately, I haven't got any access to a server with the latest PHP version - my local PHP is 5.3.8 and my public host's PHP is version 5.2.17.
9 years ago
The meta character $ accepts a (one) newline character (\n).

(Take a moment to let this information sink in)

You might want to (r)trim() your input afterwards if you have a match because otherwise it (still) might not meet a length requirement or other strange stuff might happen when you store the input as-is.
