Éditeur de flux - Chaînes

Commande de remplacement

Les opérations de substitution de texte telles que «rechercher et remplacer» sont courantes dans tout éditeur de texte. Dans cette section, nous illustrons comment SED effectue la substitution de texte. Vous trouverez ci-dessous la syntaxe de la commande de substitution.

[address1[,address2]]s/pattern/replacement/[flags]

Ici, address1 et address2sont respectivement les adresses de début et de fin, qui peuvent être des numéros de ligne ou des chaînes de motifs. Ces deux adresses sont des paramètres facultatifs. Le modèle est le texte que nous voulons remplacer par la chaîne de remplacement. De plus, nous pouvons spécifier des indicateurs facultatifs avec le SED.

Dans le fichier books.txt, nous avons utilisé une virgule (,) pour séparer chaque colonne. Utilisons la barre verticale (|) pour séparer chaque colonne. Pour ce faire, remplacez la virgule (,) par la barre verticale (|).

[jerry]$ sed 's/,/ | /' books.txt

En exécutant le code ci-dessus, vous obtenez le résultat suivant:

1) A Storm of Swords | George R. R. Martin, 1216 
2) The Two Towers | J. R. R. Tolkien, 352 
3) The Alchemist | Paulo Coelho, 197 
4) The Fellowship of the Ring | J. R. R. Tolkien, 432 
5) The Pilgrimage | Paulo Coelho, 288 
6) A Game of Thrones | George R. R. Martin, 864

Si vous observez attentivement, seule la première virgule est remplacée et la seconde reste telle quelle. Pourquoi? Dès que le modèle correspond, SED le remplace par la chaîne de remplacement et passe à la ligne suivante. Par défaut, il remplace uniquement la première occurrence. Pour remplacer toutes les occurrences, utilisez l'indicateur global (g) avec SED comme suit:

[jerry]$ sed 's/,/ | /g' books.txt

En exécutant le code ci-dessus, vous obtenez le résultat suivant:

1) A Storm of Swords | George R. R. Martin | 1216 
2) The Two Towers | J. R. R. Tolkien | 352 
3) The Alchemist | Paulo Coelho | 197 
4) The Fellowship of the Ring | J. R. R. Tolkien | 432 
5) The Pilgrimage | Paulo Coelho | 288 
6) A Game of Thrones | George R. R. Martin | 864

Désormais, toutes les occurrences de virgules (,) sont remplacées par une barre verticale (|).

Nous pouvons demander au SED d'effectuer une substitution de texte uniquement lorsqu'une correspondance de modèle réussit. L'exemple suivant remplace la virgule (,) par une barre verticale (|) uniquement lorsqu'une ligne contient le modèle The Pilgrimage.

[jerry]$ sed '/The Pilgrimage/ s/,/ | /g' books.txt

En exécutant le code ci-dessus, vous obtenez le résultat suivant:

1) A Storm of Swords, George R. R. Martin, 1216 
2) The Two Towers, J. R. R. Tolkien, 352 
3) The Alchemist, Paulo Coelho, 197 
4) The Fellowship of the Ring, J. R. R. Tolkien, 432 
5) The Pilgrimage | Paulo Coelho | 288 
6) A Game of Thrones, George R. R. Martin, 864

En plus de cela, SED peut remplacer une occurrence spécifique du modèle. Remplaçons seulement la deuxième instance de virgule (,) par une barre verticale (|).

[jerry]$ sed 's/,/ | /2' books.txt

En exécutant le code ci-dessus, vous obtenez le résultat suivant:

1) A Storm of Swords, George R. R. Martin | 1216 
2) The Two Towers, J. R. R. Tolkien | 352 
3) The Alchemist, Paulo Coelho | 197 
4) The Fellowship of the Ring, J. R. R. Tolkien | 432 
5) The Pilgrimage,Paulo Coelho | 288 
6) A Game of Thrones, George R. R. Martin  | 864

Dans l'exemple ci-dessus, le numéro à la fin de la commande SED (ou à la place du drapeau) implique la 2ème occurrence.

SED fournit une fonctionnalité intéressante. Après avoir effectué la substitution, SED fournit une option pour afficher uniquement les lignes modifiées. Pour ce faire, SED utilise lepdrapeau qui fait référence à l'impression. L'exemple suivant répertorie uniquement les lignes modifiées.

[jerry]$ sed -n 's/Paulo Coelho/PAULO COELHO/p' books.txt

En exécutant le code ci-dessus, vous obtenez le résultat suivant:

3) The Alchemist, PAULO COELHO, 197 
5) The Pilgrimage, PAULO COELHO, 288

Nous pouvons également stocker les lignes modifiées dans un autre fichier. Pour obtenir ce résultat, utilisez lewdrapeau. L'exemple suivant montre comment procéder.

[jerry]$ sed -n 's/Paulo Coelho/PAULO COELHO/w junk.txt' books.txt

Nous avons utilisé la même commande SED. Vérifions le contenu dujunk.txt fichier.

[jerry]$ cat junk.txt

En exécutant le code ci-dessus, vous obtenez le résultat suivant:

3) The Alchemist, PAULO COELHO, 197 
5) The Pilgrimage, PAULO COELHO, 288

Pour effectuer une substitution insensible à la casse, utilisez l'indicateur i qui implique d'ignorer la casse. L'exemple suivant effectue une substitution insensible à la casse.

[jerry]$ sed  -n 's/pAuLo CoElHo/PAULO COELHO/pi' books.txt

En exécutant le code ci-dessus, vous obtenez le résultat suivant:

3) The Alchemist, PAULO COELHO, 197 
5) The Pilgrimage, PAULO COELHO, 288

Jusqu'à présent, nous n'avons utilisé que la barre oblique (/) comme séparateur, mais nous pouvons également utiliser la barre verticale (|), le signe arobase (@), le caret (^), le point d'exclamation (!) Comme délimiteur. L'exemple suivant montre comment utiliser d'autres caractères comme délimiteur.

Supposons que vous ayez besoin de remplacer le chemin /bin/sed avec /home/jerry/src/sed/sed-4.2.2/sed. Par conséquent, votre commande SED ressemble à ceci:

[jerry]$ echo "/bin/sed" | sed 's/\/bin\/sed/\/home\/jerry\/src\/sed\/sed-4.2.2\/sed/'

En exécutant le code ci-dessus, vous obtenez le résultat suivant:

/home/jerry/src/sed/sed-4.2.2/sed

Nous pouvons rendre cette commande plus lisible et plus facile à comprendre. Utilisons la barre verticale (|) comme délimiteur et voyons le résultat.

[jerry]$ echo "/bin/sed" | sed 's|/bin/sed|/home/jerry/src/sed/sed-4.2.2/sed|'

En exécutant le code ci-dessus, vous obtenez le résultat suivant:

/home/jerry/src/sed/sed-4.2.2/sed

En effet! Nous avons obtenu le même résultat et la syntaxe est plus lisible. De même, nous pouvons utiliser le signe «at» (@) comme délimiteur comme suit:

[jerry]$ echo "/bin/sed" | sed 's@/bin/sed@/home/jerry/src/sed/sed-4.2.2/sed@'

En exécutant le code ci-dessus, vous obtenez le résultat suivant:

/home/jerry/src/sed/sed-4.2.2/sed

En plus de cela, nous pouvons utiliser le signe caret (^) comme délimiteur.

[jerry]$ echo "/bin/sed" | sed 's^/bin/sed^/home/jerry/src/sed/sed-4.2.2/sed^'

En exécutant le code ci-dessus, vous obtenez le résultat suivant:

/home/jerry/src/sed/sed-4.2.2/sed

Nous pouvons également utiliser un point d'exclamation (!) Comme délimiteur comme suit:

[jerry]$ echo "/bin/sed" | sed 's!/bin/sed!/home/jerry/src/sed/sed-4.2.2/sed!'

En exécutant le code ci-dessus, vous obtenez le résultat suivant:

/home/jerry/src/sed/sed-4.2.2/sed

Généralement, la barre oblique inverse (/) est utilisée comme délimiteur, mais il est parfois plus pratique d'utiliser d'autres délimiteurs pris en charge avec SED.

Créer une sous-chaîne

Nous avons appris la puissante commande de substitution. Voyons si nous pouvons trouver une sous-chaîne à partir d'un texte correspondant. Comprenons comment le faire à l'aide d'un exemple.

Considérons le texte suivant:

[jerry]$ echo "Three One Two"

Supposons que nous devions l'organiser dans une séquence. Cela signifie qu'il doit imprimer un d'abord, puis deux et enfin trois. Le one-liner suivant fait le nécessaire.

echo "Three One Two" | sed 's|\(\w\+\) \(\w\+\) \(\w\+\)|\2 \3 \1|'

Notez que dans l'exemple ci-dessus, la barre verticale (|) est utilisée comme délimiteur.

Dans SED, les sous-chaînes peuvent être spécifiées en utilisant un opérateur de regroupement et elles doivent être précédées d'un caractère d'échappement, c'est-à-dire \( et \).

\west une expression régulière qui correspond à n'importe quelle lettre, chiffre ou trait de soulignement et "+" est utilisé pour faire correspondre plusieurs caractères. En d'autres termes, l'expression régulière\(\w\+\) correspond au mot unique de la chaîne d'entrée.

Dans la chaîne d'entrée, il y a trois mots séparés par un espace, il y a donc threeexpressions régulières séparées par un espace. La première expression régulière stocke le premier mot, c'est-à-dire Trois, la seconde stocke le motOne, et le troisième stocke le mot Two

Ces sous-chaînes sont référencées par \N,où N est le numéro de sous-chaîne. Par conséquent,\2 imprime la deuxième sous-chaîne, c'est-à-dire One; \3 imprime la troisième sous-chaîne, c'est-à-dire Two; et \1 imprime la première sous-chaîne, c'est-à-dire Three

Séparons ces mots par des virgules (,) et modifions l'expression régulière en conséquence.

[jerry]$ echo "Three,One,Two" | sed 's|\(\w\+\),\(\w\+\),\(\w\+\)|\2,\3,\1|'

En exécutant le code ci-dessus, vous obtenez le résultat suivant:

One,Two,Three

Notez que maintenant, il y a une virgule (,) au lieu d'un espace dans l'expression régulière.

Drapeaux de remplacement de chaîne (GNU SED uniquement)

Dans la section précédente, nous avons vu quelques exemples de la commande de substitution. Le GNU SED fournit des séquences d'échappement spéciales qui peuvent être utilisées dans la chaîne de remplacement. Notez que ces indicateurs de remplacement de chaîne sont spécifiques à GNU et peuvent ne pas fonctionner avec d'autres variantes de SED. Ici, nous allons discuter des indicateurs de remplacement de chaîne.

  • \ L: Lorsque \ L est spécifié dans la chaîne de remplacement, il traite tous les caractères restants du mot après \ L comme des caractères minuscules. Par exemple, les caractères «ULO» sont traités comme des caractères minuscules.

[jerry]$ sed -n 's/Paulo/PA\LULO/p' books.txt

En exécutant le code ci-dessus, vous obtenez le résultat suivant:

3) The Alchemist, PAulo Coelho, 197
5) The Pilgrimage, PAulo Coelho, 288
  • \ u: Lorsque \ u est spécifié dans la chaîne de remplacement, il traite le caractère immédiat après \ u comme un caractère majuscule. Dans l'exemple suivant, \ u est utilisé avant les caractères «a» et «o». Par conséquent, SED traite ces caractères comme des lettres majuscules.

[jerry]$ sed -n 's/Paulo/p\uaul\uo/p' books.txt

En exécutant le code ci-dessus, vous obtenez le résultat suivant:

3) The Alchemist, pAulO Coelho, 197 
5) The Pilgrimage, pAulO Coelho, 288
  • \ U: Lorsque \ U est spécifié dans la chaîne de remplacement, il traite tous les caractères restants du mot après \ U comme des caractères majuscules.

[jerry]$ sed -n 's/Paulo/\Upaulo/p' books.txt

En exécutant le code ci-dessus, vous obtenez le résultat suivant:

3) The Alchemist, PAULO Coelho, 197 
5) The Pilgrimage, PAULO Coelho, 288
  • \ E: Cet indicateur doit être utilisé avec \ L ou \ U. Il arrête la conversion initiée par le drapeau \ L ou \ U. Dans l'exemple suivant, seul le premier mot est remplacé par des lettres majuscules.

[jerry]$ sed -n 's/Paulo Coelho/\Upaulo \Ecoelho/p' books.txt

En exécutant le code ci-dessus, vous obtenez le résultat suivant:

3) The Alchemist, PAULO coelho, 197 
5) The Pilgrimage, PAULO coelho, 288