स्ट्रीम संपादक - स्ट्रिंग्स

स्थानापन्न कमान

किसी पाठ संपादक में "प्रतिस्थापन और प्रतिस्थापित करें" जैसे पाठ प्रतिस्थापन संचालन आम हैं। इस खंड में, हम यह वर्णन करते हैं कि SED पाठ प्रतिस्थापन कैसे करता है। नीचे दिए गए प्रतिस्थापन कमांड का सिंटैक्स है।

[address1[,address2]]s/pattern/replacement/[flags]

यहाँ, address1 तथा address2क्रमशः शुरुआती और अंतिम पते हैं, जो या तो लाइन नंबर या पैटर्न स्ट्रिंग्स हो सकते हैं। ये दोनों पते वैकल्पिक पैरामीटर हैं। पैटर्न वह पाठ है जिसे हम प्रतिस्थापन स्ट्रिंग के साथ बदलना चाहते हैं। इसके अतिरिक्त, हम SED के साथ वैकल्पिक झंडे निर्दिष्ट कर सकते हैं।

Books.txt फ़ाइल में, हमने प्रत्येक कॉलम को अलग करने के लिए अल्पविराम (,) का उपयोग किया है। हमें प्रत्येक कॉलम को अलग करने के लिए वर्टिकल बार (|) का उपयोग करें। ऐसा करने के लिए, ऊर्ध्वाधर बार (|) के साथ अल्पविराम (,) को बदलें।

[jerry]$ sed 's/,/ | /' books.txt

उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:

1) A Storm of Swords | George R. R. Martin, 1216 
2) The Two Towers | J. R. R. Tolkien, 352 
3) The Alchemist | Paulo Coelho, 197 
4) The Fellowship of the Ring | J. R. R. Tolkien, 432 
5) The Pilgrimage | Paulo Coelho, 288 
6) A Game of Thrones | George R. R. Martin, 864

यदि आप ध्यान से देखें, तो केवल पहला अल्पविराम बदल दिया जाता है और दूसरा बना रहता है। क्यों? जैसे ही पैटर्न से मेल खाता है, SED इसे प्रतिस्थापन स्ट्रिंग के साथ बदल देता है और अगली पंक्ति में चला जाता है। डिफ़ॉल्ट रूप से, यह केवल पहली घटना को प्रतिस्थापित करता है। सभी घटनाओं को बदलने के लिए, SED के साथ वैश्विक ध्वज (छ) का उपयोग करें:

[jerry]$ sed 's/,/ | /g' books.txt

उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:

1) A Storm of Swords | George R. R. Martin | 1216 
2) The Two Towers | J. R. R. Tolkien | 352 
3) The Alchemist | Paulo Coelho | 197 
4) The Fellowship of the Ring | J. R. R. Tolkien | 432 
5) The Pilgrimage | Paulo Coelho | 288 
6) A Game of Thrones | George R. R. Martin | 864

अब अल्पविराम (,) की सभी घटनाओं को ऊर्ध्वाधर बार (|) से बदल दिया जाता है।

हम एसईडी को पाठ प्रतिस्थापन करने का निर्देश केवल तभी दे सकते हैं जब एक पैटर्न मैच सफल होता है। निम्न उदाहरण वर्टिकल बार (!) के साथ कॉमा (,) को प्रतिस्थापित करता है, जब केवल एक पंक्ति में पैटर्न होता है The Pilgrimage।

[jerry]$ sed '/The Pilgrimage/ s/,/ | /g' books.txt

उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:

1) A Storm of Swords, George R. R. Martin, 1216 
2) The Two Towers, J. R. R. Tolkien, 352 
3) The Alchemist, Paulo Coelho, 197 
4) The Fellowship of the Ring, J. R. R. Tolkien, 432 
5) The Pilgrimage | Paulo Coelho | 288 
6) A Game of Thrones, George R. R. Martin, 864

इसके अतिरिक्त, SED पैटर्न की एक विशिष्ट घटना को प्रतिस्थापित कर सकता है। हम ऊर्ध्वाधर बार (|) के साथ अल्पविराम (,) के केवल दूसरे उदाहरण को प्रतिस्थापित करते हैं।

[jerry]$ sed 's/,/ | /2' books.txt

उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:

1) A Storm of Swords, George R. R. Martin | 1216 
2) The Two Towers, J. R. R. Tolkien | 352 
3) The Alchemist, Paulo Coelho | 197 
4) The Fellowship of the Ring, J. R. R. Tolkien | 432 
5) The Pilgrimage,Paulo Coelho | 288 
6) A Game of Thrones, George R. R. Martin  | 864

उपर्युक्त उदाहरण में, SED कमांड के अंत में (या ध्वज के स्थान पर) दूसरी घटना का अर्थ है।

SED एक दिलचस्प सुविधा प्रदान करता है। प्रतिस्थापन प्रदर्शन करने के बाद, SED केवल परिवर्तित लाइनों को दिखाने का विकल्प प्रदान करता है। इस प्रयोजन के लिए, SED उपयोग करता हैpध्वज जो प्रिंट को संदर्भित करता है। निम्न उदाहरण केवल परिवर्तित लाइनों को सूचीबद्ध करता है।

[jerry]$ sed -n 's/Paulo Coelho/PAULO COELHO/p' books.txt

उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:

3) The Alchemist, PAULO COELHO, 197 
5) The Pilgrimage, PAULO COELHO, 288

हम बदले हुए लाइनों को किसी अन्य फ़ाइल में भी संग्रहीत कर सकते हैं। इस परिणाम को प्राप्त करने के लिए, का उपयोग करेंwझंडा। निम्न उदाहरण दिखाता है कि यह कैसे करना है।

[jerry]$ sed -n 's/Paulo Coelho/PAULO COELHO/w junk.txt' books.txt

हमने उसी SED कमांड का उपयोग किया। आइए हम सामग्री को सत्यापित करते हैंjunk.txt फ़ाइल।

[jerry]$ cat junk.txt

उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:

3) The Alchemist, PAULO COELHO, 197 
5) The Pilgrimage, PAULO COELHO, 288

केस-असंवेदनशील प्रतिस्थापन करने के लिए, i ध्वज का उपयोग करें जिसका अर्थ है कि अनदेखा मामला। निम्न उदाहरण केस-असंवेदनशील प्रतिस्थापन करता है।

[jerry]$ sed  -n 's/pAuLo CoElHo/PAULO COELHO/pi' books.txt

उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:

3) The Alchemist, PAULO COELHO, 197 
5) The Pilgrimage, PAULO COELHO, 288

अब तक, हमने केवल foreslash (/) वर्ण को एक सीमांकक के रूप में इस्तेमाल किया है, लेकिन हम ऊर्ध्वाधर पट्टी का उपयोग भी कर सकते हैं! ()। निम्नलिखित उदाहरण दिखाता है कि अन्य पात्रों को एक सीमांकक के रूप में कैसे उपयोग किया जाए।

हमें मान लें कि आपको पथ बदलने की आवश्यकता है /bin/sed साथ में /home/jerry/src/sed/sed-4.2.2/sed. इसलिए, आपका SED कमांड इस तरह दिखता है:

[jerry]$ echo "/bin/sed" | sed 's/\/bin\/sed/\/home\/jerry\/src\/sed\/sed-4.2.2\/sed/'

उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:

/home/jerry/src/sed/sed-4.2.2/sed

हम इस कमांड को अधिक पठनीय और समझने में आसान बना सकते हैं। हम सीमांकक के रूप में ऊर्ध्वाधर बार (!) का उपयोग करते हैं और परिणाम देखते हैं।

[jerry]$ echo "/bin/sed" | sed 's|/bin/sed|/home/jerry/src/sed/sed-4.2.2/sed|'

उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:

/home/jerry/src/sed/sed-4.2.2/sed

वास्तव में! हमें एक ही परिणाम मिला और वाक्य रचना अधिक पठनीय है। इसी प्रकार, हम "at" साइन (@) को एक सीमांकक के रूप में निम्नानुसार उपयोग कर सकते हैं:

[jerry]$ echo "/bin/sed" | sed 's@/bin/sed@/home/jerry/src/sed/sed-4.2.2/sed@'

उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:

/home/jerry/src/sed/sed-4.2.2/sed

इसके अतिरिक्त, हम एक सीमांकक के रूप में कैरेट (^) का उपयोग कर सकते हैं।

[jerry]$ echo "/bin/sed" | sed 's^/bin/sed^/home/jerry/src/sed/sed-4.2.2/sed^'

उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:

/home/jerry/src/sed/sed-4.2.2/sed

हम विस्मयादिबोधक चिह्न (!) को एक सीमांकक के रूप में निम्नानुसार उपयोग कर सकते हैं:

[jerry]$ echo "/bin/sed" | sed 's!/bin/sed!/home/jerry/src/sed/sed-4.2.2/sed!'

उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:

/home/jerry/src/sed/sed-4.2.2/sed

आम तौर पर, बैकस्लैश (/) का उपयोग सीमांकक के रूप में किया जाता है लेकिन कभी-कभी SED के साथ अन्य समर्थित परिसीमाकों का उपयोग करना अधिक सुविधाजनक होता है।

एक पदार्थ बनाना

हमने शक्तिशाली विकल्प कमान सीखी। आइए देखें कि क्या हम मिलान किए गए पाठ से एक विकल्प ढूंढ सकते हैं। आइए समझते हैं कि इसे एक उदाहरण की मदद से कैसे किया जाए।

आइए हम निम्नलिखित पाठ पर विचार करें:

[jerry]$ echo "Three One Two"

मान लीजिए हमें इसे एक क्रम में व्यवस्थित करना है। इसका मतलब है, इसे पहले वन, फिर टू और अंत में थ्री प्रिंट करना चाहिए। निम्नलिखित वन-लाइनर जरूरतमंद है।

echo "Three One Two" | sed 's|\(\w\+\) \(\w\+\) \(\w\+\)|\2 \3 \1|'

ध्यान दें कि उपरोक्त उदाहरण में, ऊर्ध्वाधर बार (|) को एक सीमांकक के रूप में उपयोग किया जाता है।

SED में, सबस्ट्रिंग को एक ग्रुपिंग ऑपरेटर का उपयोग करके निर्दिष्ट किया जा सकता है और इसे एक भागने चरित्र के साथ उपसर्ग करना चाहिए, अर्थात, \( तथा \)

\wएक नियमित अभिव्यक्ति है जो किसी भी अक्षर, अंक या अंडरस्कोर से मेल खाती है और "+" का उपयोग एक से अधिक वर्णों के मिलान के लिए किया जाता है। दूसरे शब्दों में, नियमित अभिव्यक्ति\(\w\+\) इनपुट स्ट्रिंग से एकल शब्द से मेल खाता है।

इनपुट स्ट्रिंग में, अंतरिक्ष द्वारा अलग किए गए तीन शब्द हैं, इसलिए हैं threeअंतरिक्ष द्वारा नियमित अभिव्यक्ति अलग। पहला नियमित अभिव्यक्ति पहले शब्द को संग्रहीत करता है, अर्थात, तीन, दूसरा शब्द को संग्रहीत करता हैOne, और तीसरा शब्द को संग्रहीत करता है Two

इन सबस्ट्रिंग द्वारा संदर्भित किया जाता है \N,जहां N सबस्ट्रिंग नंबर है। इसलिये,\2 दूसरे विकल्प को प्रिंट करता है, अर्थात One; \3 तीसरे विकल्प को प्रिंट करता है, अर्थात Two; तथा \1 पहला विकल्प प्रिंट करता है, अर्थात Three

हमें इन शब्दों को अल्पविराम () से अलग करते हैं और तदनुसार नियमित अभिव्यक्ति को संशोधित करते हैं।

[jerry]$ echo "Three,One,Two" | sed 's|\(\w\+\),\(\w\+\),\(\w\+\)|\2,\3,\1|'

उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:

One,Two,Three

ध्यान दें कि अब नियमित अभिव्यक्ति में स्थान के बजाय अल्पविराम (,) है।

स्ट्रिंग रिप्लेसमेंट फ्लैग्स (केवल GNU SED)

पिछले भाग में, हमने प्रतिस्थापन कमांड के कुछ उदाहरण देखे। GNU SED कुछ विशेष एस्केप सीक्वेंस प्रदान करता है जिनका उपयोग प्रतिस्थापन स्ट्रिंग में किया जा सकता है। ध्यान दें कि ये स्ट्रिंग प्रतिस्थापन झंडे जीएनयू विशिष्ट हैं और एसईडी के अन्य वेरिएंट के साथ काम नहीं कर सकते हैं। यहां हम स्ट्रिंग रिप्लेसमेंट झंडे पर चर्चा करेंगे।

  • \ L: जब प्रतिस्थापन स्ट्रिंग में \ L निर्दिष्ट किया जाता है, तो यह शब्द के सभी शेष वर्णों को \ L के बाद के निचले वर्णों के रूप में मानता है। उदाहरण के लिए, "ULO" वर्णों को लोअरकेस वर्णों के रूप में माना जाता है।

[jerry]$ sed -n 's/Paulo/PA\LULO/p' books.txt

उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:

3) The Alchemist, PAulo Coelho, 197
5) The Pilgrimage, PAulo Coelho, 288
  • \ u: जब प्रतिस्थापन स्ट्रिंग में \ u निर्दिष्ट किया जाता है, तो यह तत्काल अक्षर को अपरकेस वर्ण के रूप में मानता है। निम्न उदाहरण में, \ u का उपयोग वर्ण 'a' और 'o' से पहले किया जाता है। इसलिए एसईडी इन अक्षरों को अपरकेस अक्षर मानता है।

[jerry]$ sed -n 's/Paulo/p\uaul\uo/p' books.txt

उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:

3) The Alchemist, pAulO Coelho, 197 
5) The Pilgrimage, pAulO Coelho, 288
  • \ U: जब रिप्लेसमेंट स्ट्रिंग में \ U निर्दिष्ट किया जाता है, तो यह शब्द के सभी शेष वर्णों को \ U अपरकेस वर्णों के रूप में मानता है।

[jerry]$ sed -n 's/Paulo/\Upaulo/p' books.txt

उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:

3) The Alchemist, PAULO Coelho, 197 
5) The Pilgrimage, PAULO Coelho, 288
  • \ E: इस ध्वज का उपयोग \ L या \ U के साथ किया जाना चाहिए। यह ध्वज \ L या \ U द्वारा आरंभ किए गए रूपांतरण को रोकता है। निम्नलिखित उदाहरण में, केवल पहले शब्द को अपरकेस अक्षरों से बदल दिया गया है।

[jerry]$ sed -n 's/Paulo Coelho/\Upaulo \Ecoelho/p' books.txt

उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:

3) The Alchemist, PAULO coelho, 197 
5) The Pilgrimage, PAULO coelho, 288