स्ट्रीम संपादक - स्ट्रिंग्स
स्थानापन्न कमान
किसी पाठ संपादक में "प्रतिस्थापन और प्रतिस्थापित करें" जैसे पाठ प्रतिस्थापन संचालन आम हैं। इस खंड में, हम यह वर्णन करते हैं कि SED पाठ प्रतिस्थापन कैसे करता है। नीचे दिए गए प्रतिस्थापन कमांड का सिंटैक्स है।
[address1[,address2]]s/pattern/replacement/[flags]
यहाँ, address1 तथा address2क्रमशः शुरुआती और अंतिम पते हैं, जो या तो लाइन नंबर या पैटर्न स्ट्रिंग्स हो सकते हैं। ये दोनों पते वैकल्पिक पैरामीटर हैं। पैटर्न वह पाठ है जिसे हम प्रतिस्थापन स्ट्रिंग के साथ बदलना चाहते हैं। इसके अतिरिक्त, हम SED के साथ वैकल्पिक झंडे निर्दिष्ट कर सकते हैं।
Books.txt फ़ाइल में, हमने प्रत्येक कॉलम को अलग करने के लिए अल्पविराम (,) का उपयोग किया है। हमें प्रत्येक कॉलम को अलग करने के लिए वर्टिकल बार (|) का उपयोग करें। ऐसा करने के लिए, ऊर्ध्वाधर बार (|) के साथ अल्पविराम (,) को बदलें।
[jerry]$ sed 's/,/ | /' books.txt
उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:
1) A Storm of Swords | George R. R. Martin, 1216
2) The Two Towers | J. R. R. Tolkien, 352
3) The Alchemist | Paulo Coelho, 197
4) The Fellowship of the Ring | J. R. R. Tolkien, 432
5) The Pilgrimage | Paulo Coelho, 288
6) A Game of Thrones | George R. R. Martin, 864
यदि आप ध्यान से देखें, तो केवल पहला अल्पविराम बदल दिया जाता है और दूसरा बना रहता है। क्यों? जैसे ही पैटर्न से मेल खाता है, SED इसे प्रतिस्थापन स्ट्रिंग के साथ बदल देता है और अगली पंक्ति में चला जाता है। डिफ़ॉल्ट रूप से, यह केवल पहली घटना को प्रतिस्थापित करता है। सभी घटनाओं को बदलने के लिए, SED के साथ वैश्विक ध्वज (छ) का उपयोग करें:
[jerry]$ sed 's/,/ | /g' books.txt
उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:
1) A Storm of Swords | George R. R. Martin | 1216
2) The Two Towers | J. R. R. Tolkien | 352
3) The Alchemist | Paulo Coelho | 197
4) The Fellowship of the Ring | J. R. R. Tolkien | 432
5) The Pilgrimage | Paulo Coelho | 288
6) A Game of Thrones | George R. R. Martin | 864
अब अल्पविराम (,) की सभी घटनाओं को ऊर्ध्वाधर बार (|) से बदल दिया जाता है।
हम एसईडी को पाठ प्रतिस्थापन करने का निर्देश केवल तभी दे सकते हैं जब एक पैटर्न मैच सफल होता है। निम्न उदाहरण वर्टिकल बार (!) के साथ कॉमा (,) को प्रतिस्थापित करता है, जब केवल एक पंक्ति में पैटर्न होता है The Pilgrimage।
[jerry]$ sed '/The Pilgrimage/ s/,/ | /g' books.txt
उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:
1) A Storm of Swords, George R. R. Martin, 1216
2) The Two Towers, J. R. R. Tolkien, 352
3) The Alchemist, Paulo Coelho, 197
4) The Fellowship of the Ring, J. R. R. Tolkien, 432
5) The Pilgrimage | Paulo Coelho | 288
6) A Game of Thrones, George R. R. Martin, 864
इसके अतिरिक्त, SED पैटर्न की एक विशिष्ट घटना को प्रतिस्थापित कर सकता है। हम ऊर्ध्वाधर बार (|) के साथ अल्पविराम (,) के केवल दूसरे उदाहरण को प्रतिस्थापित करते हैं।
[jerry]$ sed 's/,/ | /2' books.txt
उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:
1) A Storm of Swords, George R. R. Martin | 1216
2) The Two Towers, J. R. R. Tolkien | 352
3) The Alchemist, Paulo Coelho | 197
4) The Fellowship of the Ring, J. R. R. Tolkien | 432
5) The Pilgrimage,Paulo Coelho | 288
6) A Game of Thrones, George R. R. Martin | 864
उपर्युक्त उदाहरण में, SED कमांड के अंत में (या ध्वज के स्थान पर) दूसरी घटना का अर्थ है।
SED एक दिलचस्प सुविधा प्रदान करता है। प्रतिस्थापन प्रदर्शन करने के बाद, SED केवल परिवर्तित लाइनों को दिखाने का विकल्प प्रदान करता है। इस प्रयोजन के लिए, SED उपयोग करता हैpध्वज जो प्रिंट को संदर्भित करता है। निम्न उदाहरण केवल परिवर्तित लाइनों को सूचीबद्ध करता है।
[jerry]$ sed -n 's/Paulo Coelho/PAULO COELHO/p' books.txt
उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:
3) The Alchemist, PAULO COELHO, 197
5) The Pilgrimage, PAULO COELHO, 288
हम बदले हुए लाइनों को किसी अन्य फ़ाइल में भी संग्रहीत कर सकते हैं। इस परिणाम को प्राप्त करने के लिए, का उपयोग करेंwझंडा। निम्न उदाहरण दिखाता है कि यह कैसे करना है।
[jerry]$ sed -n 's/Paulo Coelho/PAULO COELHO/w junk.txt' books.txt
हमने उसी SED कमांड का उपयोग किया। आइए हम सामग्री को सत्यापित करते हैंjunk.txt फ़ाइल।
[jerry]$ cat junk.txt
उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:
3) The Alchemist, PAULO COELHO, 197
5) The Pilgrimage, PAULO COELHO, 288
केस-असंवेदनशील प्रतिस्थापन करने के लिए, i ध्वज का उपयोग करें जिसका अर्थ है कि अनदेखा मामला। निम्न उदाहरण केस-असंवेदनशील प्रतिस्थापन करता है।
[jerry]$ sed -n 's/pAuLo CoElHo/PAULO COELHO/pi' books.txt
उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:
3) The Alchemist, PAULO COELHO, 197
5) The Pilgrimage, PAULO COELHO, 288
अब तक, हमने केवल foreslash (/) वर्ण को एक सीमांकक के रूप में इस्तेमाल किया है, लेकिन हम ऊर्ध्वाधर पट्टी का उपयोग भी कर सकते हैं! ()। निम्नलिखित उदाहरण दिखाता है कि अन्य पात्रों को एक सीमांकक के रूप में कैसे उपयोग किया जाए।
हमें मान लें कि आपको पथ बदलने की आवश्यकता है /bin/sed साथ में /home/jerry/src/sed/sed-4.2.2/sed. इसलिए, आपका SED कमांड इस तरह दिखता है:
[jerry]$ echo "/bin/sed" | sed 's/\/bin\/sed/\/home\/jerry\/src\/sed\/sed-4.2.2\/sed/'
उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:
/home/jerry/src/sed/sed-4.2.2/sed
हम इस कमांड को अधिक पठनीय और समझने में आसान बना सकते हैं। हम सीमांकक के रूप में ऊर्ध्वाधर बार (!) का उपयोग करते हैं और परिणाम देखते हैं।
[jerry]$ echo "/bin/sed" | sed 's|/bin/sed|/home/jerry/src/sed/sed-4.2.2/sed|'
उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:
/home/jerry/src/sed/sed-4.2.2/sed
वास्तव में! हमें एक ही परिणाम मिला और वाक्य रचना अधिक पठनीय है। इसी प्रकार, हम "at" साइन (@) को एक सीमांकक के रूप में निम्नानुसार उपयोग कर सकते हैं:
[jerry]$ echo "/bin/sed" | sed 's@/bin/sed@/home/jerry/src/sed/sed-4.2.2/sed@'
उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:
/home/jerry/src/sed/sed-4.2.2/sed
इसके अतिरिक्त, हम एक सीमांकक के रूप में कैरेट (^) का उपयोग कर सकते हैं।
[jerry]$ echo "/bin/sed" | sed 's^/bin/sed^/home/jerry/src/sed/sed-4.2.2/sed^'
उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:
/home/jerry/src/sed/sed-4.2.2/sed
हम विस्मयादिबोधक चिह्न (!) को एक सीमांकक के रूप में निम्नानुसार उपयोग कर सकते हैं:
[jerry]$ echo "/bin/sed" | sed 's!/bin/sed!/home/jerry/src/sed/sed-4.2.2/sed!'
उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:
/home/jerry/src/sed/sed-4.2.2/sed
आम तौर पर, बैकस्लैश (/) का उपयोग सीमांकक के रूप में किया जाता है लेकिन कभी-कभी SED के साथ अन्य समर्थित परिसीमाकों का उपयोग करना अधिक सुविधाजनक होता है।
एक पदार्थ बनाना
हमने शक्तिशाली विकल्प कमान सीखी। आइए देखें कि क्या हम मिलान किए गए पाठ से एक विकल्प ढूंढ सकते हैं। आइए समझते हैं कि इसे एक उदाहरण की मदद से कैसे किया जाए।
आइए हम निम्नलिखित पाठ पर विचार करें:
[jerry]$ echo "Three One Two"
मान लीजिए हमें इसे एक क्रम में व्यवस्थित करना है। इसका मतलब है, इसे पहले वन, फिर टू और अंत में थ्री प्रिंट करना चाहिए। निम्नलिखित वन-लाइनर जरूरतमंद है।
echo "Three One Two" | sed 's|\(\w\+\) \(\w\+\) \(\w\+\)|\2 \3 \1|'
ध्यान दें कि उपरोक्त उदाहरण में, ऊर्ध्वाधर बार (|) को एक सीमांकक के रूप में उपयोग किया जाता है।
SED में, सबस्ट्रिंग को एक ग्रुपिंग ऑपरेटर का उपयोग करके निर्दिष्ट किया जा सकता है और इसे एक भागने चरित्र के साथ उपसर्ग करना चाहिए, अर्थात, \( तथा \)।
\wएक नियमित अभिव्यक्ति है जो किसी भी अक्षर, अंक या अंडरस्कोर से मेल खाती है और "+" का उपयोग एक से अधिक वर्णों के मिलान के लिए किया जाता है। दूसरे शब्दों में, नियमित अभिव्यक्ति\(\w\+\) इनपुट स्ट्रिंग से एकल शब्द से मेल खाता है।
इनपुट स्ट्रिंग में, अंतरिक्ष द्वारा अलग किए गए तीन शब्द हैं, इसलिए हैं threeअंतरिक्ष द्वारा नियमित अभिव्यक्ति अलग। पहला नियमित अभिव्यक्ति पहले शब्द को संग्रहीत करता है, अर्थात, तीन, दूसरा शब्द को संग्रहीत करता हैOne, और तीसरा शब्द को संग्रहीत करता है Two
इन सबस्ट्रिंग द्वारा संदर्भित किया जाता है \N,जहां N सबस्ट्रिंग नंबर है। इसलिये,\2 दूसरे विकल्प को प्रिंट करता है, अर्थात One; \3 तीसरे विकल्प को प्रिंट करता है, अर्थात Two; तथा \1 पहला विकल्प प्रिंट करता है, अर्थात Three
हमें इन शब्दों को अल्पविराम () से अलग करते हैं और तदनुसार नियमित अभिव्यक्ति को संशोधित करते हैं।
[jerry]$ echo "Three,One,Two" | sed 's|\(\w\+\),\(\w\+\),\(\w\+\)|\2,\3,\1|'
उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:
One,Two,Three
ध्यान दें कि अब नियमित अभिव्यक्ति में स्थान के बजाय अल्पविराम (,) है।
स्ट्रिंग रिप्लेसमेंट फ्लैग्स (केवल GNU SED)
पिछले भाग में, हमने प्रतिस्थापन कमांड के कुछ उदाहरण देखे। GNU SED कुछ विशेष एस्केप सीक्वेंस प्रदान करता है जिनका उपयोग प्रतिस्थापन स्ट्रिंग में किया जा सकता है। ध्यान दें कि ये स्ट्रिंग प्रतिस्थापन झंडे जीएनयू विशिष्ट हैं और एसईडी के अन्य वेरिएंट के साथ काम नहीं कर सकते हैं। यहां हम स्ट्रिंग रिप्लेसमेंट झंडे पर चर्चा करेंगे।
\ L: जब प्रतिस्थापन स्ट्रिंग में \ L निर्दिष्ट किया जाता है, तो यह शब्द के सभी शेष वर्णों को \ L के बाद के निचले वर्णों के रूप में मानता है। उदाहरण के लिए, "ULO" वर्णों को लोअरकेस वर्णों के रूप में माना जाता है।
[jerry]$ sed -n 's/Paulo/PA\LULO/p' books.txt
उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:
3) The Alchemist, PAulo Coelho, 197
5) The Pilgrimage, PAulo Coelho, 288
\ u: जब प्रतिस्थापन स्ट्रिंग में \ u निर्दिष्ट किया जाता है, तो यह तत्काल अक्षर को अपरकेस वर्ण के रूप में मानता है। निम्न उदाहरण में, \ u का उपयोग वर्ण 'a' और 'o' से पहले किया जाता है। इसलिए एसईडी इन अक्षरों को अपरकेस अक्षर मानता है।
[jerry]$ sed -n 's/Paulo/p\uaul\uo/p' books.txt
उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:
3) The Alchemist, pAulO Coelho, 197
5) The Pilgrimage, pAulO Coelho, 288
\ U: जब रिप्लेसमेंट स्ट्रिंग में \ U निर्दिष्ट किया जाता है, तो यह शब्द के सभी शेष वर्णों को \ U अपरकेस वर्णों के रूप में मानता है।
[jerry]$ sed -n 's/Paulo/\Upaulo/p' books.txt
उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:
3) The Alchemist, PAULO Coelho, 197
5) The Pilgrimage, PAULO Coelho, 288
\ E: इस ध्वज का उपयोग \ L या \ U के साथ किया जाना चाहिए। यह ध्वज \ L या \ U द्वारा आरंभ किए गए रूपांतरण को रोकता है। निम्नलिखित उदाहरण में, केवल पहले शब्द को अपरकेस अक्षरों से बदल दिया गया है।
[jerry]$ sed -n 's/Paulo Coelho/\Upaulo \Ecoelho/p' books.txt
उपरोक्त कोड निष्पादित करने पर, आपको निम्न परिणाम मिलते हैं:
3) The Alchemist, PAULO coelho, 197
5) The Pilgrimage, PAULO coelho, 288