PHP - नियमित अभिव्यक्तियाँ
नियमित अभिव्यक्तियाँ स्वयं वर्णों के अनुक्रम या प्रतिरूप से अधिक कुछ नहीं हैं। वे पैटर्न-मिलान कार्यक्षमता के लिए नींव प्रदान करते हैं।
नियमित अभिव्यक्ति का उपयोग करके आप एक विशेष स्ट्रिंग को दूसरी स्ट्रिंग के अंदर खोज सकते हैं, आप एक स्ट्रिंग को दूसरे स्ट्रिंग से बदल सकते हैं और आप एक स्ट्रिंग को कई विखंडू में विभाजित कर सकते हैं।
PHP नियमित अभिव्यक्ति कार्यों के दो सेटों के लिए विशिष्ट कार्य प्रदान करता है, प्रत्येक एक निश्चित प्रकार की नियमित अभिव्यक्ति के अनुरूप है। आप अपने आराम के आधार पर उनमें से किसी का उपयोग कर सकते हैं।
- POSIX नियमित अभिव्यक्तियाँ
- पर्ल स्टाइल रेगुलर एक्सप्रेशंस
POSIX नियमित अभिव्यक्तियाँ
POSIX नियमित अभिव्यक्ति की संरचना एक विशिष्ट अंकगणितीय अभिव्यक्ति के लिए भिन्न नहीं है: विभिन्न तत्वों (ऑपरेटरों) को और अधिक जटिल अभिव्यक्ति बनाने के लिए संयुक्त किया जाता है।
सबसे सरल नियमित अभिव्यक्ति वह है जो किसी एक वर्ण से मेल खाती है, जैसे कि जी, जी के अंदर के तार जैसे कि जी, हैगल, या बैग।
POSIX नियमित अभिव्यक्ति में उपयोग की जा रही कुछ अवधारणाओं के लिए स्पष्टीकरण दें। उसके बाद हम आपको नियमित अभिव्यक्ति संबंधित कार्यों से परिचित कराएंगे।
कोष्ठक
नियमित अभिव्यक्तियों के संदर्भ में उपयोग किए जाने पर ब्रैकेट ([]) का एक विशेष अर्थ है। उनका उपयोग वर्णों की श्रेणी खोजने के लिए किया जाता है।
अनु क्रमांक | अभिव्यक्ति और विवरण |
---|---|
1 | [0-9] यह 0 से 9 तक किसी भी दशमलव अंक से मेल खाता है। |
2 | [a-z] यह लोअरकेस के माध्यम से लोअरकेस z से किसी भी वर्ण से मेल खाता है। |
3 | [A-Z] यह अपरकेस Z के माध्यम से अपरकेस ए के किसी भी चरित्र से मेल खाता है। |
4 | [a-Z] यह अपरकेस Z के माध्यम से लोअरकेस से किसी भी वर्ण से मेल खाता है। |
ऊपर दिखाई गई श्रेणियां सामान्य हैं; आप किसी भी दशमलव अंक को 0 से 3 के माध्यम से मिलान करने के लिए [0-3] की सीमा का उपयोग कर सकते हैं, या किसी भी लोअरकेस वर्ण को v से b से लेकर श्रेणी से मिलान करने के लिए [bv] श्रेणी से ले सकते हैं।
परिमाणकों
ब्रैकेटेड चरित्र अनुक्रमों और एकल वर्णों की आवृत्ति या स्थिति को एक विशेष चरित्र द्वारा निरूपित किया जा सकता है। प्रत्येक विशेष चरित्र एक विशिष्ट अर्थ है। द +, *,,; {int। रेंज}, और $ झंडे सभी एक चरित्र अनुक्रम का पालन करते हैं।
अनु क्रमांक | अभिव्यक्ति और विवरण |
---|---|
1 | p+ यह कम से कम एक पी युक्त किसी भी तार से मेल खाता है। |
2 | p* यह शून्य या अधिक पी युक्त किसी भी तार से मेल खाता है। |
3 | p? यह शून्य या एक पी के युक्त किसी भी तार से मेल खाता है। |
4 | p{N} यह किसी भी तार से मेल खाता है जिसमें एक अनुक्रम है N पी के |
5 | p{2,3} यह दो या तीन पी के अनुक्रम वाले किसी भी तार से मेल खाता है। |
6 | p{2, } यह किसी भी तार से मेल खाता है जिसमें कम से कम दो p का अनुक्रम होता है। |
7 | p$ यह इसके अंत में p के साथ किसी भी स्ट्रिंग से मेल खाता है। |
8 | ^पी यह इसके आरंभ में p के साथ किसी भी तार से मेल खाता है। |
उदाहरण
निम्नलिखित उदाहरण मिलान पात्रों के बारे में आपकी अवधारणाओं को स्पष्ट करेंगे।
अनु क्रमांक | अभिव्यक्ति और विवरण |
---|---|
1 | [^a-zA-Z] यह किसी भी तार से मेल खाता है जिसमें Z और A से Z के बीच का कोई भी वर्ण नहीं है। |
2 | p.p यह पी से युक्त किसी भी स्ट्रिंग से मेल खाता है, इसके बाद किसी भी वर्ण का, इसके बाद दूसरे पी का। |
3 | ^.{2}$ यह किसी भी तार से मेल खाता है जिसमें दो अक्षर हैं। |
4 | <b>(.*)</b> यह <b> और </ b> के भीतर संलग्न किसी भी स्ट्रिंग से मेल खाता है। |
5 | p(hp)* यह एपी या अनुक्रम पीएचपी के अधिक उदाहरणों के बाद एपी युक्त किसी भी स्ट्रिंग से मेल खाता है। |
पूर्वनिर्धारित चरित्र रेंज
आपकी प्रोग्रामिंग सुविधा के लिए कई पूर्वनिर्धारित चरित्र श्रेणियां, जिन्हें चरित्र वर्ग भी कहा जाता है, उपलब्ध हैं। वर्ण वर्ग में वर्णों की एक पूरी श्रृंखला है, उदाहरण के लिए, वर्णमाला या पूर्णांक सेट -
अनु क्रमांक | अभिव्यक्ति और विवरण |
---|---|
1 | [[:alpha:]] यह zZ के माध्यम से वर्णमाला एए युक्त किसी भी स्ट्रिंग से मेल खाता है। |
2 | [[:digit:]] यह 9 के माध्यम से संख्यात्मक अंकों वाले किसी भी स्ट्रिंग से मेल खाता है। |
3 | [[:alnum:]] यह 9 के माध्यम से zZ और 0 के माध्यम से अल्फ़ान्यूमेरिक वर्ण एए युक्त किसी भी स्ट्रिंग से मेल खाता है। |
4 | [[:space:]] यह अंतरिक्ष से युक्त किसी भी तार से मेल खाता है। |
PHP का Regexp POSIX फ़ंक्शंस
PHP वर्तमान में POSIX- शैली के नियमित भावों का उपयोग करके स्ट्रिंग्स को खोजने के लिए सात कार्य प्रदान करता है -
अनु क्रमांक | समारोह विवरण |
---|---|
1 | एरेग () Ereg () फ़ंक्शन पैटर्न द्वारा निर्दिष्ट स्ट्रिंग के लिए स्ट्रिंग द्वारा निर्दिष्ट एक स्ट्रिंग की खोज करता है, यदि पैटर्न पाया जाता है, तो यह सच है और अन्यथा गलत है। |
2 | ereg_replace () Ereg_replace () फ़ंक्शन पैटर्न द्वारा निर्दिष्ट स्ट्रिंग के लिए खोज करता है और यदि प्रतिस्थापन पाया जाता है तो पैटर्न को बदल देता है। |
3 | eregi () Eregi () फ़ंक्शन स्ट्रिंग द्वारा निर्दिष्ट स्ट्रिंग के लिए पैटर्न द्वारा निर्दिष्ट एक स्ट्रिंग में खोज करता है। खोज संवेदनशील नहीं है। |
4 | eregi_replace () Eregi_replace () फ़ंक्शन ठीक ereg_replace () की तरह काम करता है, सिवाय इसके कि स्ट्रिंग में पैटर्न की खोज संवेदनशील नहीं है। |
5 | विभाजित करें() विभाजन () फ़ंक्शन स्ट्रिंग को विभिन्न तत्वों में विभाजित करेगा, स्ट्रिंग में पैटर्न की घटना के आधार पर प्रत्येक तत्व की सीमाएं। |
6 | spliti () स्प्लिटि () फ़ंक्शन ठीक उसी तरीके से संचालित होता है जैसे कि इसके सिबलिंग स्प्लिट (), सिवाय इसके कि यह संवेदनशील नहीं है। |
7 | sql_regcase () Sql_regcase () फ़ंक्शन को एक उपयोगिता फ़ंक्शन के रूप में माना जा सकता है, जो इनपुट पैरामीटर स्ट्रिंग में प्रत्येक वर्ण को दो वर्णों वाले ब्रैकेटेड अभिव्यक्ति में परिवर्तित करता है। |
पर्ल स्टाइल रेगुलर एक्सप्रेशंस
पर्ल शैली की नियमित अभिव्यक्तियाँ उनके POSIX समकक्षों के समान हैं। POSIX सिंटैक्स का उपयोग लगभग पूरी तरह से पर्ल-स्टाइल रेगुलर एक्सप्रेशन फ़ंक्शंस के साथ किया जा सकता है। वास्तव में, आप पिछले POSIX अनुभाग में शुरू किए गए किसी भी मात्रा का उपयोग कर सकते हैं।
पेरेल रेगुलर एक्सप्रेशंस में उपयोग किए जा रहे कुछ कॉन्सेप्ट्स के लिए स्पष्टीकरण देते हैं। उसके बाद हम आपको नियमित अभिव्यक्ति संबंधित कार्यों के लिए पेश करेंगे।
मेटा अक्षर
एक मेटा चरित्र बस एक वर्णमाला वर्ण है जो एक बैकस्लैश से पहले होता है जो संयोजन को एक विशेष अर्थ देने के लिए कार्य करता है।
उदाहरण के लिए, आप 'd' मेटा कैरेक्टर का उपयोग करके बड़ी रकम की तलाश कर सकते हैं: /([\d]+)000/, यहाँ \d संख्यात्मक चरित्र के किसी भी स्ट्रिंग के लिए खोज करेंगे।
निम्नलिखित मेटा पात्रों की सूची है, जिनका उपयोग पर्ल स्टाइल रेगुलर एक्सप्रेशंस में किया जा सकता है।
Character Description
. a single character
\s a whitespace character (space, tab, newline)
\S non-whitespace character
\d a digit (0-9)
\D a non-digit
\w a word character (a-z, A-Z, 0-9, _)
\W a non-word character
[aeiou] matches a single character in the given set
[^aeiou] matches a single character outside the given set
(foo|bar|baz) matches any of the alternatives specified
संशोधक
कई मॉडिफायर्स उपलब्ध हैं जो रेगेक्स के साथ आपके काम को बहुत आसान बना सकते हैं, जैसे केस सेंसिटिविटी, कई लाइनों में सर्च करना आदि।
Modifier Description
i Makes the match case insensitive
m Specifies that if the string has newline or carriage
return characters, the ^ and $ operators will now
match against a newline boundary, instead of a
string boundary
o Evaluates the expression only once
s Allows use of . to match a newline character
x Allows you to use white space in the expression for clarity
g Globally finds all matches
cg Allows a search to continue even after a global match fails
PHP का Regexp PERL कम्पैटिबल फंक्शंस
PHP पर्ल-संगत नियमित अभिव्यक्तियों का उपयोग करके स्ट्रिंग्स को खोजने के लिए निम्नलिखित कार्य प्रदान करता है -
अनु क्रमांक | समारोह विवरण |
---|---|
1 | () के Preg_match () फ़ंक्शन पैटर्न के लिए स्ट्रिंग खोजता है, यदि पैटर्न मौजूद है, और सही तो सही है। |
2 | preg_match_all () Preg_match_all () फ़ंक्शन स्ट्रिंग में पैटर्न की सभी घटनाओं से मेल खाता है। |
3 | preg_replace () Preg_replace () फ़ंक्शन ereg_replace () की तरह ही काम करता है, सिवाय इसके कि नियमित रूप से पैटर्न और प्रतिस्थापन इनपुट मापदंडों में उपयोग किया जा सकता है। |
4 | preg_split () Preg_split () फ़ंक्शन बिल्कुल विभाजन () की तरह संचालित होता है, सिवाय इसके कि नियमित अभिव्यक्तियों को पैटर्न के लिए इनपुट मापदंडों के रूप में स्वीकार किया जाता है। |
5 | preg_grep () Preg_grep () फ़ंक्शन, इनपुट_अरे के सभी तत्वों को खोजता है, जो सभी तत्वों को regexp पैटर्न से मेल खाता है। |
6 | preg_ बोली () नियमित अभिव्यक्ति वर्णों का उद्धरण करें |