Différences entre les versions de « Regexp »

Version actuelle datée du 28 mai 2013 à 10:46

Dans le jargon informatique, une expression régulière, ou Regexp, est une chaîne de caractères désignant un ensemble de chaînes de caractères respectant une syntaxe particulière. Elle est très utile dans la manipulation de texte, pour rechercher, remplacer ou supprimer des expressions rencontrées fréquemment.

Métacaractères

Un métacaractère est un symbole faisant partie d'une expression régulière et qui remplit une fonction précise. Quelques exemples d'application suivent ce tableau.

Métacaractères	Fonction
?	0 ou 1 fois l'expression précédente
*	0, 1 ou plusieurs fois l'expression précédente
+	1 ou plusieurs fois l'expression précédente
{n}	`n` fois l’expression précédente
{m,n}	`m` fois minimum et `n` fois maximum l’expression précédente
^	Négation ou début de ligne
$	Fin de ligne
[]	Un ou plusieurs des objets entre crochets doivent être présents
()	Tous les objets entre parenthèses doivent être présents
\|	Opérateur « ou ».

N.B. : Pour que « * » ne soit pas interprété comme un métacaractère, il faut plutôt utiliser « \* ».

Exemples

Dans les exemples ci-dessous, chaque expression régulière est suivie de la chaîne de caractères qu'elle représente.

abc? : ab ou abc.
abc* : ab, abc, abcc, ...
abc+ : abc, abcc, abccc, ...
abc{2} : abcc.
abc{2,} : abcc, abccc, ...
abc{2,4} : abcc, abccc, abcccc.
^début : chaîne commençant par « début ».
fin$ : chaîne se terminant par « fin ».
[abc] : a, b ou c; équivalent à (a|b|c).
[a-z] : une des lettres de l'alphabet.
[a-zA-Z] : union de [a-z] et [A-Z].
a(bc)* : a, abc, abcbc, ...
un|le : « un » ou « le ».
(un|le) chien : « un chien » ou « le chien ».
^abc+ : abc, abcc, abccc, ...
^chaîne$ : chaîne qui commence et se termine par « chaîne ».
(a|b)* : chaîne contenant une suite de a ou de b.
^.{3}$ : chaîne de 3 caractères exactement.

Combinaison avec `grep`

Recherche de « smu » au début de chaque ligne dans fichier :

grep "^smu" fichier

Retourne les lignes commençant par « ^s » dans fichier :

grep "\^s" fichier

Affiche les lignes contenant « Smu » ou « smu » dans fichier :

grep "[Ss]mu" fichier

Recherche les lignes vides dans fichier :

grep "^$" fichier

Recherche les lignes contenant 2 chiffres côte à côte dans fichier :

grep "[0-9][0-9]" fichier

Recherche de fichiers

Pour chercher des fichiers dont le nom satisfait à une expression régulière, il suffit de combiner les commandes grep et ls à l'aide d'un pipeline (« | »). Par exemple, pour énumérer les fichiers du répertoire courant dont le nom est abc, abcbc, abcbcbc, etc., il suffit d'utiliser la ligne suivante :

ls -R | grep -E "a(bc)+"

Voir aussi

Articles connexes

Références externes

Regular expression sur Wikipedia

@@ Ligne 35 : / Ligne 35 : @@
 |-
 ![]
-|Les crochets définissent une [[Regexp#Classes_et_blocs_de_caractères|classe de caractères]]
+|Un ou plusieurs des objets entre crochets doivent être présents
 |-
 !()
-|Les crochets définissent un [[Regexp#Classes_et_blocs_de_caractères|bloc de caractères]]
+|Tous les objets entre parenthèses doivent être présents
 |-
 ! <nowiki>|</nowiki>
@@ Ligne 46 : / Ligne 46 : @@
-'''N.B.&nbsp;:''' Pour que &laquo;&nbsp;<tt>*</tt>&nbsp;&raquo; ne soit pas interprété comme un métacaractère, il faut plutôt utiliser &laquo;&nbsp;<tt>\*</tt>&nbsp;&raquo; ou &laquo;&nbsp;[*]&nbsp;&raquo;.
+'''N.B.&nbsp;:''' Pour que &laquo;&nbsp;<tt>*</tt>&nbsp;&raquo; ne soit pas interprété comme un métacaractère, il faut plutôt utiliser &laquo;&nbsp;<tt>\*</tt>&nbsp;&raquo;.
 ==== Exemples ====
@@ Ligne 57 : / Ligne 57 : @@
 * <tt>abc{2,}</tt>&nbsp;: <tt>abcc</tt>, <tt>abccc</tt>, ...
 * <tt>abc{2,4}</tt>&nbsp;: <tt>abcc</tt>, <tt>abccc</tt>, <tt>abcccc</tt>.
-* <tt>^début</tt>&nbsp;: toute chaîne commençant par &laquo;&nbsp;<tt>début</tt>&nbsp;&raquo;.
+* <tt>^début</tt>&nbsp;: chaîne commençant par &laquo;&nbsp;<tt>début</tt>&nbsp;&raquo;.
-* <tt>fin$</tt>&nbsp;: toute chaîne se terminant par &laquo;&nbsp;<tt>début</tt>&nbsp;&raquo;.
+* <tt>fin$</tt>&nbsp;: chaîne se terminant par &laquo;&nbsp;<tt>fin</tt>&nbsp;&raquo;.
-* <tt>[abc]</tt>&nbsp;: <tt>a</tt>, <tt>b</tt> ou <tt>c</tt>.
+* <tt>[abc]</tt>&nbsp;: <tt>a</tt>, <tt>b</tt> ou <tt>c</tt>; équivalent à <tt>(a|b|c)</tt>.
+* <tt>[a-z]</tt>&nbsp;: une des lettres de [http://fr.wikipedia.org/wiki/Alphabet l'alphabet].
+* <tt>[a-zA-Z]</tt>&nbsp;: union de <tt>[a-z]</tt> et <tt>[A-Z]</tt>.
 * <tt>a(bc)*</tt>&nbsp;: <tt>a</tt>, <tt>abc</tt>, <tt>abcbc</tt>, ...
-* <tt>un|le</tt>&nbsp;: chaîne qui contient un ou le
+* <tt>un|le</tt>&nbsp;: &laquo;&nbsp;<tt>un</tt>&nbsp;&raquo; ou &laquo;&nbsp;<tt>le</tt>&nbsp;&raquo;.
-* <tt>(un|le) chien</tt>&nbsp;: chaîne qui contient un chien ou le chien
+* <tt>(un|le) chien</tt>&nbsp;: &laquo;&nbsp;<tt>un chien</tt>&nbsp;&raquo; ou &laquo;&nbsp;<tt>le chien</tt>&nbsp;&raquo;.
-* <tt>^abc+</tt>&nbsp;: chaîne commençant par ab suivie de un ou plusieurs c (abc, abcc ...)
+* <tt>^abc+</tt>&nbsp;: <tt>abc</tt>, <tt>abcc</tt>, <tt>abccc</tt>, ...
-* <tt>^chaîne$</tt>&nbsp;: chaîne qui commence et se termine par chaîne
+* <tt>^chaîne$</tt>&nbsp;: chaîne qui commence et se termine par &laquo;&nbsp;<tt>chaîne</tt>&nbsp;&raquo;.
-* <tt>(a|b)*</tt>&nbsp;: chaîne qui contient une suite de a ou de b
+* <tt>(a|b)*</tt>&nbsp;: chaîne contenant une suite de <tt>a</tt> ou de <tt>b</tt>.
-* <tt>^.{3}$</tt>&nbsp;: chaîne qui contient 3 caractères exactement.
+* <tt>^.{3}$</tt>&nbsp;: chaîne de 3 caractères exactement.
-=== Classes et blocs de caractères ===
-Une classe est définie en spécifiant, entre crochets &laquo;&nbsp;[ ]&nbsp;&raquo;, les caractères en faisant partie. L'utilisation de [[Regexp#Métacaractères|métacaractères]] est autorisée.
-{| class="wikitable"  style="margin: auto; text-align: left;"
-|-
-! Classe !! Signification
-|-
-![abc]
-|Les caractères <tt>a</tt>, <tt>b</tt> et <tt>c</tt>.
-|-
-![a-z]
-|Toutes les lettres de [http://fr.wikipedia.org/wiki/Alphabet l'alphabet].
-|-
-![^abc]
-|Toutes les lettres de l'alphabet, sauf <tt>a</tt>, <tt>b</tt> et <tt>c</tt>.
-|-
-![a-zA-Z]
-|L'union des classes <tt>[a-z]</tt> et <tt>[A-Z]</tt>.
-|-
-|}
-==== Exemples ====
-* [abc]: chaîne qui contient un a, un b, ou un c.
-* [a-z]: chaîne qui contient un caractère compris entre a et z.
-* ^[a-zA-Z]: chaîne qui commence par une lettre minuscule ou majuscule.
-* ^[^a-zA-Z]: chaîne qui ne commence pas par une lettre.
-* [\+?{}.]: chaîne qui contient un de ces six caractères : \+?{}.
 === Combinaison avec [[La_commande_grep|<tt>grep</tt>]] ===
+* Recherche de &laquo;&nbsp;<tt>smu</tt>&nbsp;&raquo; au début de chaque ligne dans <tt>fichier</tt>&nbsp;:
 <pre>
-grep '^smu' file
+grep "^smu" fichier
 </pre>
-cherche 'smu' au début de chaque ligne dans file.
+* Retourne les lignes commençant par &laquo;&nbsp;<tt>^s</tt>&nbsp;&raquo; dans <tt>fichier</tt>&nbsp;:
 <pre>
-grep 'smu$' file</pre>
+grep "\^s" fichier
-cherche 'smu' à la fin de chaque ligne dans file.
-<pre>
-grep '^smu$' file
-</pre>retourne les lignes contenant seulement et exactement 'smu'.
-<pre>
-grep '\^s' file
 </pre>
-retourne les lignes commençant par '^s',car "\" permet de considérer ^ comme un caractère normal et non plus un méta-caractère.
+* Affiche les lignes contenant &laquo;&nbsp;<tt>Smu</tt>&nbsp;&raquo; ou &laquo;&nbsp;<tt>smu</tt>&nbsp;&raquo; dans <tt>fichier</tt>&nbsp;:
 <pre>
-grep '[Ss]mu' file
+grep "[Ss]mu" fichier
 </pre>
-affiche les lignes contenant 'Smu' ou 'smu'.
+* Recherche les lignes vides dans <tt>fichier</tt>&nbsp;:
-<pre>
-grep 'B[oO][bB]' file
-</pre> affiche les lignes contenant BOB, Bob, BOb or BoB.
 <pre>
-grep '^$' file
+grep "^$" fichier
 </pre>
-recherche les lignes vides dans file.
+* Recherche les lignes contenant 2 chiffres côte à côte dans <tt>fichier</tt>&nbsp;:
 <pre>
-grep '[0-9][0-9]' file
+grep "[0-9][0-9]" fichier
 </pre>
-recherche les lignes contenant 2 chiffres côte à côte.
 === Recherche de fichiers ===
@@ Ligne 139 : / Ligne 103 : @@
 * [[Commandes_élémentaires|Commandes élémentaires]]
-* [[La_commande_grep|<tt>find</tt>]]
+* [[Commandes_élémentaires#ls|<tt>ls</tt>]]
 * [[La_commande_grep|<tt>grep</tt>]]
-* [[La_commande_grep|<tt>sed</tt>]]
+* [[Pipelining_et_redirection|Pipeline]]
+* [[La_commande_sed|<tt>sed</tt>]]
 === Références externes ===
 * [http://en.wikipedia.org/wiki/Regular_expression ''Regular expression'' sur Wikipedia]

Différences entre les versions de « Regexp »