एक नियमित अभिव्यक्ति का उपयोग करके ईमेल पते को कैसे मान्य किया जाए?
इन वर्षों में मैंने धीरे-धीरे एक नियमित अभिव्यक्ति विकसित की है जो MOST ईमेल पतों को सही ढंग से मान्य करती है, यह मानते हुए कि वे आईपी पते का उपयोग सर्वर भाग के रूप में नहीं करते हैं।
मैं इसे कई PHP कार्यक्रमों में उपयोग करता हूं, और यह ज्यादातर समय काम करता है। हालाँकि, समय-समय पर मुझे किसी ऐसे व्यक्ति से संपर्क होता है जो किसी ऐसी साइट से परेशान है जो इसका उपयोग करता है, और मैं कुछ समायोजन करने के लिए समाप्त हो गया हूं (हाल ही में मुझे एहसास हुआ कि मैं 4-वर्ण TLDs की अनुमति नहीं दे रहा था)।
ईमेलों को मान्य करने के लिए आपके पास सबसे अच्छा नियमित अभिव्यक्ति क्या है या आपने देखा है?
मैंने कई समाधानों का उपयोग किया है जो कई छोटी अभिव्यक्तियों का उपयोग करने वाले फ़ंक्शन का उपयोग करते हैं, लेकिन मैं एक साधारण फ़ंक्शन में एक लंबी जटिल अभिव्यक्ति के बजाय कई छोटे अभिव्यक्ति एक अधिक जटिल फ़ंक्शन में करूँगा।
जवाब
पूरी तरह से RFC 822 अनुरूप regex अक्षम और इसकी लंबाई की वजह से अस्पष्ट है। सौभाग्य से, RFC 822 को दो बार अलग किया गया था और ईमेल पते के लिए वर्तमान विनिर्देश RFC 5322 है । RFC 5322 एक रेगेक्स की ओर जाता है जिसे समझा जा सकता है अगर कुछ मिनटों के लिए अध्ययन किया जाए और वास्तविक उपयोग के लिए पर्याप्त कुशल हो।
पृष्ठ के शीर्ष पर एक RFC 5322 आज्ञाकारी regex पाया जा सकता है http://emailregex.com/लेकिन आईपी एड्रेस पैटर्न का उपयोग करता है जो इंटरनेट पर बग के साथ तैर रहा है जो 00
किसी भी बाइटेड दशमलव मानों को डॉट-सीमांकित पते में अनुमति देता है, जो कि अवैध है। इसके बाकी भाग RFC 5322 व्याकरण के अनुरूप प्रतीत होते हैं और कई परीक्षणों का उपयोग करते हुए गुजरते हैं grep -Po
, जिनमें केस डोमेन नाम, आईपी पते, बुरे लोग और खाते के नाम बिना उद्धरण सहित शामिल हैं।
00
आईपी पैटर्न में बग को ठीक करते हुए , हम एक कामकाजी और काफी तेज रेगेक्स प्राप्त करते हैं। (वास्तविक कोड के लिए प्रदान किए गए संस्करण को परिमार्जन करें, अंकन नहीं।)
(?: [a-z0-9! #$%&'*+/=?^_`{|}~-]+(?:\.[a-z0-9!#$% & '* + / =? ^ _ `{|} ~ -] +) * |" (?!: [\ _ x01- \ x08 \ x0b \ x0c \ x0e- \ X1f \ x21 \ x23 \ _ x5b \ x5d- \ x7f] | \\ [\ x01- \ x09 \ x0b \ x0c \ x0e- \ x7f]) * ") @ (?:? (?: [a-z0-9]] (?: [a-z0-9-9? ] * [[a-z0-9])?!) + [a-z0-9] (?:? [a-z0-9 -] * * [a-z0-9])? -? \ _ (? :( ;:( 2 (5 [0-5] | [0-4] [0-9]) | 1 [0-9] [0-9] | [1-9]? [0-9])} | ।) {3} (? :( 2 (5 [0-5] | [0-4]] [0-9]) | 1 [0-9] [0-9] | [1-9]? [0 -9]) | [a-z0-9 -] * [a-z0-9]:: (?: [\ X01- \ x08 \ x0b \ x0c \ x0e- \ X1f \ x21-- [x5a \ x53- \ x7f] ] | \\ [\ x01- \ x09 \ x0b \ x0c \ x0e- \ x7f]) +) \])
या:
(?:[a-z0-9!#$%&'*+/=?^_`{|}~-]+(?:\.[a-z0-9!#$%&'*+/=?^_`{|}~-]+)*|"(?:[\x01-\x08\x0b\x0c\x0e-\x1f\x21\x23-\x5b\x5d-\x7f]|\\[\x01-\x09\x0b\x0c\x0e-\x7f])*")@(?:(?:[a-z0-9](?:[a-z0-9-]*[a-z0-9])?\.)+[a-z0-9](?:[a-z0-9-]*[a-z0-9])?|\[(?:(?:(2(5[0-5]|[0-4][0-9])|1[0-9][0-9]|[1-9]?[0-9]))\.){3}(?:(2(5[0-5]|[0-4][0-9])|1[0-9][0-9]|[1-9]?[0-9])|[a-z0-9-]*[a-z0-9]:(?:[\x01-\x08\x0b\x0c\x0e-\x1f\x21-\x5a\x53-\x7f]|\\[\x01-\x09\x0b\x0c\x0e-\x7f])+)\])
ऊपर regexp के लिए परिमित राज्य मशीन का आरेख है जो स्वयं regexp से अधिक स्पष्ट है
पर्ल और पीसीआरई (regex लाइब्रेरी जैसे PHP में प्रयुक्त) में अधिक परिष्कृत पैटर्न सही ढंग से अड़चन के बिना RFC 5322 को पार्स कर सकते हैं । पायथन और सी # भी ऐसा कर सकते हैं, लेकिन वे पहले दो से एक अलग वाक्यविन्यास का उपयोग करते हैं। हालांकि, यदि आपको कई कम शक्तिशाली पैटर्न-मिलान भाषाओं में से एक का उपयोग करने के लिए मजबूर किया जाता है, तो असली पार्सर का उपयोग करना सबसे अच्छा है।
यह समझना भी महत्वपूर्ण है कि आरएफसी के अनुसार इसे मान्य करना आपको इस बारे में बिल्कुल कुछ नहीं बताता कि क्या वह पता वास्तव में आपूर्ति किए गए डोमेन पर मौजूद है, या क्या पता दर्ज करने वाला व्यक्ति इसका असली मालिक है। लोग दूसरों को हर समय इस तरह से मेलिंग सूचियों पर हस्ताक्षर करते हैं। फिक्सिंग जिसमें एक कट्टर प्रकार की मान्यता की आवश्यकता होती है जिसमें उस पते को एक संदेश भेजना शामिल होता है जिसमें एक पुष्टिकरण टोकन शामिल होता है जिसका अर्थ उसी वेब पेज पर दर्ज किया जाना चाहिए जैसा कि पता था।
पुष्टिकरण टोकन आपको पता करने का एकमात्र तरीका है कि आपको इसमें प्रवेश करने वाले व्यक्ति का पता मिला है। यही कारण है कि अधिकांश मेलिंग सूचियाँ अब साइन-अप की पुष्टि करने के लिए उस तंत्र का उपयोग करती हैं। सब के बाद, कोई भी नीचे रख सकता है [email protected]
, और वह भी कानूनी रूप में पार्स करेगा, लेकिन दूसरे छोर पर व्यक्ति होने की संभावना नहीं है।
PHP के लिए, आपको PHP के साथ ई-मेल पते को मान्य करने में दिए गए पैटर्न का उपयोग नहीं करना चाहिए , जिस तरीके से मैं उद्धरण करता हूं:
कुछ खतरा है कि आम उपयोग और व्यापक मैला कोडिंग ई-मेल पते के लिए एक वास्तविक मानक स्थापित करेगा जो रिकॉर्ड किए गए औपचारिक मानक से अधिक प्रतिबंधात्मक है।
यह अन्य सभी गैर-आरएफसी पैटर्न से बेहतर नहीं है। यह RFC 822 को संभालने के लिए भी इतना स्मार्ट नहीं है , अकेले RFC 5322 को छोड़ दें। यह एक है , हालांकि।
यदि आप फैंसी और पांडित्य प्राप्त करना चाहते हैं, तो एक पूर्ण राज्य इंजन लागू करें । एक नियमित अभिव्यक्ति केवल एक अल्पविकसित फ़िल्टर के रूप में कार्य कर सकती है। नियमित अभिव्यक्तियों के साथ समस्या यह है कि किसी को यह बताना कि उनका पूरी तरह से वैध ई-मेल पता अमान्य है (एक गलत सकारात्मक) क्योंकि आपकी नियमित अभिव्यक्ति इसे संभाल नहीं सकती है यह उपयोगकर्ता के दृष्टिकोण से सिर्फ अशिष्ट और असभ्य है। उद्देश्य के लिए एक राज्य इंजन ई-मेल पते को मान्य और सही भी कर सकता है, जिसे अन्यथा अमान्य माना जाएगा क्योंकि यह प्रत्येक RFC के अनुसार ई-मेल पते को असम्बद्ध करता है। यह संभावित रूप से अधिक सुखदायक अनुभव के लिए अनुमति देता है, जैसे
निर्दिष्ट ई-मेल पता 'myemail @ पता, com' अमान्य है। क्या आपका मतलब '[email protected]' था?
टिप्पणियों सहित ईमेल पते को मान्य करना भी देखें । या ई-मेल पते की तुलना नियमित अभिव्यक्तियों को मान्य करना ।
डीबगेजक्स डेमो
आपको ईमेल पतों को मान्य करने के लिए नियमित अभिव्यक्तियों का उपयोग नहीं करना चाहिए।
इसके बजाय, इस तरह MailAddress वर्ग का उपयोग करें:
try {
address = new MailAddress(address).Address;
} catch(FormatException) {
// address is invalid
}
MailAddress
वर्ग RFC822 के साथ पूर्ण अनुसार पते को प्रमाणित करने के लिए एक BNF पार्सर का उपयोग करता है।
यदि आप MailAddress
ई-मेल पते को मान्य करने के लिए उपयोग करने की योजना बनाते हैं , तो ध्यान रखें कि यह दृष्टिकोण ई-मेल पते के प्रदर्शन नाम भाग को भी स्वीकार करता है, और यह वही नहीं हो सकता है जिसे आप प्राप्त करना चाहते हैं। उदाहरण के लिए, यह इन स्ट्रिंग्स को मान्य ई-मेल पते के रूप में स्वीकार करता है:
- "[email protected]; [email protected]"
- "[email protected]; [email protected]; [email protected]"
- "उपयोगकर्ता प्रदर्शन नाम [email protected]"
- "user4 @ company.com"
इनमें से कुछ मामलों में, स्ट्रिंग के अंतिम भाग को पते के रूप में पार्स किया जाता है; बाकी इससे पहले कि प्रदर्शन नाम है। बिना किसी प्रदर्शन नाम के सादा ई-मेल पता प्राप्त करने के लिए, आप अपने मूल स्ट्रिंग के खिलाफ सामान्यीकृत पते की जांच कर सकते हैं।
bool isValid = false;
try
{
MailAddress address = new MailAddress(emailAddress);
isValid = (address.Address == emailAddress);
// or
// isValid = string.IsNullOrEmpty(address.DisplayName);
}
catch (FormatException)
{
// address is invalid
}
इसके अलावा, एक पते के अंत में एक डॉट है, जैसे user@company.
MailAddress द्वारा भी स्वीकार किया जाता है।
यदि आप वास्तव में रेगेक्स का उपयोग करना चाहते हैं, तो यह है :
(?:? (?: \ r \ n)? [\ t]) * (?:? (?:? (?: [^ () <> @, ;: \\ "। \ [\ \] \ 000- \ 031 ] + (:?:?:? (?: \ r \ n)? [\ t] ) + | \ Z | (; = [\ _ "() <> @;; \\"। \ [\ _ \ _]])] "): (?: [^ \" R \\] | \\ |?:?: (?: \ r \ n)? [\ t])) * "(? :( ?:?) \ r \ n)? [\ t]) *) (?: \ _? (?:? (?: \ r \ n)? [\ t]) * (?:? [^ () <> @, ?: \ \ "। \ [\] \ 000- \ 031] + (? :( ?: ?:( ?: \ r \ n)? [\ t]) + | \ Z | (? = [\ _ ["(>>>,: \\"। \ [\ \]])) | " ^ \ "\ r \\] | \\।? (?:? (?: \ r \ n)?] \ t])) * "(?:? (?: \ r \ n)? [\ t]) *)) * @ @ (?:?: (?: \ r \ n)? [\ t]) * (?: [^ () <> @ ;: \\ "। \ [\ \] \ 000- \ ० 31] + (?:?:? (?: \ R \ n)? [\ T]) + | \ _9 ((? =? [[\ "() <> @ ;: \\"। \ [\ " ]]))) | \ [([^ \ [\ \ \ r \\] | \\।) * \ _ ]:??: (?: (\ r \ n)? [\ t]) *) (?: \ _? ((?:? (?: \ r \ n)? [\ t]) * (?: [^)) <> @, ;: \\ "। \ [\ \" \ 000- \ 031] + (?:? (?:?: \ r \ n)? [\ t]) + | \ Z | ((=! [\ _ "() <> @; ;: \\"। \ [\]])। ) | \ [([^ \ _ \ _ \ r \\] | \\। * *] (?: (?: \ r \ n)? [\ t]) *)) * |:? (?: [^ () <> @,?: \\ "। \ [\ \] \ 000- \ 031] + (?:?) (?: (?: \ r \ n)? [\ t]) + | \ Z |? =? = [\ ["() <> @ ;: \\"। \ [[\]])] "।" (?: ?: [^ \ "\ r \\] | \\। (?:?) ?: \ r \ n)? [\ t]) * * "(?:? (?: \ r \ n)?" ? [\ t]) *) * \ <(?:? (?: \ r \ n); [\ t]) * (?: @:?: (?: [^ () <> @,?: \\ "। \ [\] \ ०००- \ ०३१] + (?:? (?:? (?:) r \ n)? [\ t]) + | \ Z | (? = [\ _ "() <> @,;: \\"। \ [[\]])) | \ _ ([^ \ _ \ _] ] \ r \\] | \\।) * \] (?:? (?: \ r \ n)?] \ t]) *) (?:?: \??:? (?: \ r \ n)? [\ t]) * (?:? [^ () <> @ ;: \\ "। \ [\]। \ 000- \ 031] + (?:? (?:? (?: \ R \ n) ; [\ t]) + | \ Z | (; = [\ _ "() <> @, ;: \\"। \ [\ _]]) | \ _ ([^ \ _ \ _] \ r \ _ \]। \\।) * \] (?:? (?: \ r \ n)? [\ t] ) *)) * (: ?:, @ (?:? (?: \ r \ n)? [\ t]) * (?: ?: [^ () <> @, ;: \\ "। \ [\] \ _ 000- \ 031] + (?:? (?: ?: \ r \ n)? [ \ t]) + | \ Z | (; = [\ _ "() <> @ ;: \\"। \ [\ "])) | \ _ ([^ \ _ \ _] \ r \\] | \\।) * \] (?:? (?: \ r \ n)? [\ t]) * ) (?: \?!?:? (?: \ r \ n)? [\ t]) * (?: [^ () <> @, ;: \\ "। \ [\ \] \ 000- \ 031। ] + (:?:?:? (?: \ r \ n)? [\ t] ) + | \ Z | (; = [\ _ "() <> @;; \\"। \ [\ _ \ _]])} \ _ ([[\ _ \ _ \ _ \ _] \ _ \ _] | )) * \] (?:? (?: \ r \ n)? [\ t]) *)) *) *: (?:? (?: \ r \ n)? [\ t]) *)? (?: ?: [^ () <> @,: \\ "। \ [\ \] \ 000- \ 031] +। (?: (?: ?: ?: \ r \ n)? [\ t]) + | \ Z | (! =! ([\ ["() <> @;; \\"। \ [\ _]])) | "(!:! [^ \" \ R \\] | \ _ | | ?: (?: (\ r \ n)? [\ t]) * * "(?:? (?: \ r) \ n); [\ t]) *) (?: \? (?:? (?: \ r \ n); [\ t]) * (?:? [^ () <> @; ;: \\ " । \ [\] \ 000- \ 031] + (? :(? :(?) \ r \ n)? [\ t]) + | \ Z | (? = [\ _ "() <> @,?: \\"। \ [\ \]])) "" (?: [^ \ " "\ r \\] | \\। | (?:? (?: \ r \ n)? [\ t] ])) * "(?:? (?: \ r \ n)? [\ t]) *)) * @ (?:?: (?:? \ r \ n)? [\ t]) * (?: [^] () <> @ ;: \\ "। \ [\ \" \ 000- \ 031; ] + (:?: (?:? (?: \ r \ n)? [\ t]) + | \ Z | (? =? [[\ "() <> @, ;: \\"। \ [] ))) | \ [([^ \ _ \ _ \ r \\] | \\।) * \] | ?: (?: (\ r \ n)? [\ t]) *) (?: \? (?: ?: (?: \ r \ n)? [\ t]) * (?:?] [^ () <> @,?: \\ "। \ [\ \] \ 000- \ 031] + (?) : (??: (?: \ r \ n)? [\ t]) + | \ Z | (? =? [[\ "() <> @;: \\"। \ [\]]) | \ [([^ \ _ \ _ \ r \\] | \\।) * \] (? :(?) : \ r \ n); [\ t]) *)) * \> (?:? (?: \ r \ n)? [\ t]) *) |: (?: [^ () <> @,; : \\ "। \ [\ \] \ 000- \ 031] + (? :(?) : (?? \ r \ n)? [\ t]) + | \ Z | (? = [\ _ "() <> @,:? \\"। \ [[\]])] "(?) : [^ \ "\ r \\] | \\।? (?:? (?: \ r \ n)? [\ t])) * "(?:? (?: \ r \ n)? [\ t]) *) *:: (?:?: (?:: \ r \ n)? [\ t]) * (?: (?: (?: [^ () <> @ ;: \\ "। \ [\]] \ 000- \ 031] + (?:? (?:? (\? R \ n); [\ t]) + | \ z9 ((? = [\ _ "() <> @; ;: \\") |। [[\]])) | "(?: [^ \" \ r \\] | \\।: (?:? (?: \ r \ n)? [\ t]) * * "(?:? ((?: \ r \ n)? [\ t]) *) (?: ?: (?) : (?: \ r \ n)? [\ t]) * (?: [^ () <> @,: \\ "। \ [\ \" \ 000- \ 031] + (?:? (?:? (?: \ R \ n)? [\ T]) + | \ Z | (? = [\] [] "() <> @;; \\" (। \ [\]])) | (?: [^ \ "\ r \\] | \\। | (?:? (?: \ r \ n)? [\ t]) * *" (?:? (?: \ r \ n)?] \ t]) *)) * @ (?:? (?: \ r \ n)? [\ t] ) * (?: [^ () <> @ ;: \\ "। \ [\ \] \ 000- \ 0 0]] + (?: ?:? (?: ?: \ r \ n)? [\ T] + | \ Z | (; = [\ ["() <> @, ;: \\ "। \ [(\]])) | \ _ ([[\ _ \ _ \ _ \ _] | \ _।) * \"]: (?: ?: (\ _ r \ n)? [\ t] * * ) (?: \?!?:? (?: \ r \ n)? [\ t]) * (? : [^ () <> @,? \\ "। \ [\ \" \ 000- \ 031] +?:?:? (?: (?: ?: \ r \ n)? [\ T]) + | \ Z |; = = [\ ["() <> @;: \\"। \ _ \]]))) | \ _ ([[\ _ \ _ \ _ \ _] | \\।) * \ _। ?: ?:?: (?: \ r \ n)? [\ t]) *)) * | (?: [^ () <> @ ;: \\ "। \ [\ \] \ 000- \ 031] + (?:? (?:? (?: \ R \ n)? [\ T]) +_ Z और | (=? [[\ "() <> @, ;: \\"। \]])) | "(?!: [^ \" \ r \\] | \\ | | ?:? (?: \ r \ n)? [\ t]) * * "(?:? (?: (\ r \ n)? [\ t]) *) * * </?: (?:? \ r \ n) n); [\ t]) * (?: @ @?: [^ () <> @ ,; : \\ "। \ [\ \" \ 000- \ 031] + (?:? (?:? (?: \ \ \ N)? [\ T]) + | \ z | (? =? [[\ ") () <> @, ;: \\ "। \ [(\]])) | \ _ ([ ^ \ [[\] \ r \\] | \\।) * \] (?:? (?: \ r \ n)? [\ t]) *) (?: ?: (?: ?: ?: \ r) \ n); [\ t]) * (?: [^ () <> @, ;: \\ " । \ [[\] \ ०००- \ ०३१] + (?:? (?:? (\ R \ n)? [\ T]) + | \ z | (? =? [\ _ "() <> @ ;: \\ "। \ _ [[]]) | \ _ ([[\ _ \ _] ] \ r \\] | \\।) * \] (?:? (?: \ r \ n)? [\ t]) *)) *?: ?, (@ ?: (?: ?: \ r \ n) ); [\ t]) * (?: [^ () <> @, ;: \\ "। \ _ [\] \ ०००- \ ०३१] + (?: (?:? (?: \ R \ n); [\ _]] + = \ z | (? =? [\ _ ’’ () <> @;;) \\ "। \ [[\]]) | \ _ ([^ \ _ \ _] r \\] | \\।) * \] (?:? (?: \ r \ n)? [\ t] * *) (?: (\ ?: ?: ?: (?: \ r \ n)?] t]) * (?: [^ () <> @ ;: \\ "। \ [\] \ 000- \ 031] + (?:? (?:? (\? R \ n); [\ t]) + | \ z9 ((? = [\ _ "() <> @; ;: \\") । \ [[\]]) | \ _ ([[\ _ \ _] \ r \\] | (\\।) * \] (?:? (?: \ r \ n)? [\ t]) *)) *) *::: (:?: (?:: \ r \ n)? [\ t] * * ); (?: [^ () <> @ ;: \\ "। \ [\ \] \ 0 00- \ 031] + (?:? (?:? (\ _ R \ n)? [\ T]) = \ _ Z | और! =! [[\ "() <> @;;: \\"। \ [(\]])) | "(?!: [^ \" \ r \\] | \ _ । | (?:?:? (?: \ r \ n)? [\ t]) * * "(?:? (?: (\ r \ n)? [\ t]) *) (?: ?: \?: (?) ?: \ r \ n)? [\ t]) * (?: [^ () <> @? ;: \\ "। \ [\ \" \ 000- \ 031] + (?:? (?:? (?: \ \ \ N)? [\ T]) + | \ z | (? =? [[\ ") ) <> @,; \\ "। \ [[\]])) |" (? : [^ \ "\ r \\] | \\। | (?:? (?: \ r \ n)? [\ t]) * *":? (?: (?: \ r \ n)? [\ t )) *)) * @ (?:? (?: \ r \ n)? [\ t]) * (?: [^ () <> @ ;: \\ "। \ [\ \" \ 000- \ 031] + (?:?: (?:: ?: \ r \ n)? [\ T]) +? \ Z | (; = [\ ["() <> @;; \\"। \ [[\]])) | \ _ ([[\ _ \ _ \ _ \ _] | \\।) \ _ \ _] (?:? (?: \ r \ n)? [\ t]) *) (?) ?: \!?:? (?: \ r \ n)? [\ t]) * (?:?) ^ () <> @ ;: \\ "। \ [\ \" \ 000- \ 031] + (?:?:?: ?: ?: \ r \ n)? [\ T]) + | \ Z | ( ; = [\ ["() <> @ ;: \\"। \ [\] ])) | \ _ ([[\ _ \ _ \ _ \ _] | \\।) * \ _ ()? (?: ?: \ r \ n)? [\ t]) *)) * \ _ (?) ?: (?: \ r \ n)? [\ t]) *) (?:, \ s * ( ?:? (?: [^ () <> @ ;: \\ "। \ [\ \] \ 000- \ 0 0]] + (?: ?:? (?: ?: \ r \ n)? [\ T] + | \ Z | (; = [\ ["() <> @, ;: \\ "। \ [[\]]))" (?: ?: [^ \ "\ r \\] | \\? |?:?: ?: ?: (?: \ r \ n)? [\ t])) *" (? : (?: \ r \ n)? [\ t]) *) (?:?: \?: ?: ?: \ r \ n)? [\ t]) * (?: [^ () <> @,?: \\ "। \ [\ \" \ 000- \ 031] + (? :( ?:(?) : \ r \ n)? [\ t]) + | \ Z | ((=?) \ ["() <> @,; \\"। \ [[\]])) | "(?:? [[\ \" \ r \\] | \\। n); [\ t])) * "(?:? (?: \ r \ n)? [\ t] )) *)) * @ (?:? (?: \ r \ n)? [\ t]) * (?: [^ () <> @;: \\ "। \ [\ \] \ 000- \। 031] + (?:? (?:? (?: \ R \ n)? [\ T ]) + | \ Z | (; = [\ _ "() <> @;; \\"। \ [\ _]]) \ _ [([^ \ _ \ _ \ R \\] | | \ (।) * \]?:? (?:? \ r \ n)? [\ t]) *) (?) : \ _! (?: ?:? \ r \ n)? [\ t]) * (?: [^ ()>>:; \\ "। \ [\ \" \ 000- \ 031] + ()। ?: (?:?:?: \ r \ n)? [\ t]) + | \ Z | (? =! [[\ "() <> @ ;: \\"। \ [\ _]])) | \ _ ([[\ _ \ _ \ _ \ _ \ _] | \\।) * \] (?:?:?: \ r \ n)? [\ t]) *)) * | (?: [^ () <> @ ;: \\ "। \ [\ \] \ ०००- \ ०३१] + (?:?: (?:: !: \ r \ n)? [\ T]) + | \ Z | (=? [\ _ "" () <> @ ;: \\ "। \ _" ]))) | "" (?:? [^ \ "\ r \\] | \\। | (?:? (?:? \ r \ n)? [\ t])) *" (?:? (?: \ _) r \ n)? [\ t]) *) * \ <(?:? (?: \ r \ n) ? [\ t]) * (?: @ (?: [^ () <> @ ;: \\ "। \ [\ \" \ 000- \ 031] + (?:? (?: ?: ?: r) \ n)? [\ t]) + | \ Z | (? =? [[] () <> @ ;: \\ "। \ [[\]])] | \ _ ([[\ _ \ _ \ _ \ _] \ _ \ _।) * \" (?:? (?: \ r) \ n)? [\ t]) *) (?: \ _? (?:? (?: \ r \ n)? ? [\ t]) * (?: [^ () <> @;; \\ "। \ [\ \" \ 000- \ 031] + (?:? (?:? (?: \ r \ n))। [\ t]) + | \ Z | (? = [\ ["() <> @,:: \\ "। \ _ [[]]) | \ _ ([[\ _ \ _ \ _ \ _ \ _] | \ _।) * \" (?:? (?: \ r \ n)) [\ t]) *)) * (?:, @ (?:? (?: \ r \ n)?] \ t]) * (?: [^ () <> @;? \\ "। \ [\ \] \ 000- \ 031] + (?:? (?:? (?: \ r \ n)?] \ _ t]) + | \ Z | (; = [\ _ "() <> @; ;: \\ "। \ [[\]]) | \ _ ([[\ _ \ _ \ _ \ _ \ _ | \ _ \ _। * *] (?:? (?: \ r \ n)?] t]) *) (?:?: (??:? (?: \ r \ n)? [\ t] ) * (?: [^ () <> @ ;: \\ "। \ [\ \] \ 000- \ 0 0]] + (?: ?:? (?: ?: \ r \ n)? [\ T] + | \ Z | (; = [\ ["() <> @, ;: \\ "। \ [(\]])) | \ _ ([[\ _ \ _ \ _ \ _] | \ _।) * \"]: (?: ?: (\ _ r \ n)? [\ t] * * )) *) *:: (?:? (?: \ r \ n)? [\ t]) *)? (?: [^ () <> @ ;: \\ "। \ [\ \" \ 000- \ 031] + (?:?: (?:: ?: \ r \ n)? [\ T]) +? \ Z | (; = [\ ["() <> @;; \\"। \ [[\]])) | "(??: [^ \" \ r \\] | \\। | - (?:? (?:? \ r \ n)? [\ t])) * "(? :( ?: \ r \ n)? [\ t]) *) (?:?: \? (? :( ?:) \ r \ n)? [\ t]) * (?: [^ () <> @ ;: \\ "। \ [\ \" \ 000- \ 031] + (?:?:? (?:? (\ _) r \ n)? [\ t]) + | \ Z | (! =! [\] "() <> @,?: \\"। \ [\ []]) | ""? (?: [^ \ "\ r \\] | \\। - (?:? (?: \ r \ n)) ? [\ t])) * "(?:? (?: \ r \ n)? [\ t]" *)) * @ (?:? (?: \ r \ n)? [\ t]) * (?: [^ () <> @, ;: \\ "। \ [\ \] \ 000- \ 031]। + +?: (?:? (?: \ r \ n)? [\ t]) + | \ Z | (!? = [\ _ "() <> @;; \\"। \ [\ _]])) | \ _ ([^ \ _ \ _ \ _ \ _] \ _ \ _ ) * \] (?: (?: \ r \ n)? [\ t]) *) (?: \? ।?:? (?: (?: \ r \ n)? [\ t]) * (?: [^ () <> @,?: \\ "। \ [\ \] \ 000- \ 031] + (?:?) (?: (?: \ r \ n)? [\ t]) + | \ Z |! =? = [\ ["() <> @ ;: \\"। \ [\ _]]): \ _ ([[[\ _ \ _ \ _ \ _ \ _] | \\।) * \ _] (?: (?: \ r \ n)? [\ t]) *)) * \> (?:? ?: \ r \ n)? [\ t]) *))))?;? s *)
यह प्रश्न बहुत कुछ पूछा जाता है, लेकिन मुझे लगता है कि आपको अपने कदम वापस लेने चाहिए और अपने आप से पूछना चाहिए कि आप ईमेल एड्रेक्ट्स को वैधानिक रूप से मान्य क्यों करना चाहते हैं? वास्तव में लाभ क्या है?
- यह सामान्य टाइपो को नहीं पकड़ेगा।
- यह लोगों को अमान्य या बने-बनाए ईमेल पतों को दर्ज करने या किसी और के पते पर जाने से नहीं रोकता है।
यदि आप यह प्रमाणित करना चाहते हैं कि कोई ईमेल सही है, तो आपके पास पुष्टिकरण ईमेल भेजने और उपयोगकर्ता के पास इसका उत्तर देने के अलावा कोई विकल्प नहीं है। कई मामलों में आप होगा है सुरक्षा कारणों से या नैतिक कारणों के लिए वैसे भी एक पुष्टिकरण मेल भेजने के लिए (ताकि आप उनकी मर्जी के खिलाफ एक सेवा के लिए साइन अप नहीं किसी को जैसे सकते हैं)।
यह सब इस बात पर निर्भर करता है कि आप कितना सही होना चाहते हैं। अपने उद्देश्यों के लिए, जहां मैं सिर्फ चीजों को रखने की कोशिश कर रहा हूं bob @ aol.com
(ईमेल में रिक्त स्थान) या steve
(कोई भी डोमेन नहीं) या mary@aolcom
(.com से पहले कोई अवधि नहीं), मैं उपयोग करता हूं।
/^\S+@\S+\.\S+$/
ज़रूर, यह उन चीजों से मेल खाएगा जो मान्य ईमेल पते नहीं हैं, लेकिन यह सामान्य सरल त्रुटियों को प्राप्त करने की बात है।
उस regex में कुछ भी बदलाव किए जा सकते हैं (और कुछ इस उत्तर के लिए टिप्पणियों में हैं), लेकिन यह सरल, और समझने में आसान है, और यह एक अच्छा पहला प्रयास है।
यह इस बात पर निर्भर करता है कि आपका सबसे अच्छा मतलब क्या है: यदि आप हर वैध ईमेल पते को पकड़ने की बात कर रहे हैं, तो निम्न का उपयोग करें:
(?:(?:\r\n)?[ \t])*(?:(?:(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t]
)+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:
\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(
?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[
\t]))*"(?:(?:\r\n)?[ \t])*))*@(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\0
31]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\
](?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+
(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:
(?:\r\n)?[ \t])*))*|(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z
|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)
?[ \t])*)*\<(?:(?:\r\n)?[ \t])*(?:@(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\
r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[
\t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)
?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t]
)*))*(?:,@(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[
\t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*
)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t]
)+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*)
*:(?:(?:\r\n)?[ \t])*)?(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+
|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r
\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:
\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t
]))*"(?:(?:\r\n)?[ \t])*))*@(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031
]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](
?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?
:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?
:\r\n)?[ \t])*))*\>(?:(?:\r\n)?[ \t])*)|(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?
:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?
[ \t]))*"(?:(?:\r\n)?[ \t])*)*:(?:(?:\r\n)?[ \t])*(?:(?:(?:[^()<>@,;:\\".\[\]
\000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|
\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>
@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"
(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*))*@(?:(?:\r\n)?[ \t]
)*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\
".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?
:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[
\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*|(?:[^()<>@,;:\\".\[\] \000-
\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(
?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*)*\<(?:(?:\r\n)?[ \t])*(?:@(?:[^()<>@,;
:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([
^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\"
.\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\
]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*(?:,@(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\
[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\
r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\]
\000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]
|\\.)*\](?:(?:\r\n)?[ \t])*))*)*:(?:(?:\r\n)?[ \t])*)?(?:[^()<>@,;:\\".\[\] \0
00-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\
.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,
;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|"(?
:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*))*@(?:(?:\r\n)?[ \t])*
(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".
\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t])*(?:[
^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\]
]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*\>(?:(?:\r\n)?[ \t])*)(?:,\s*(
?:(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\
".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*)(?:\.(?:(
?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[
\["()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t
])*))*@(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t
])+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?
:\.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|
\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*|(?:
[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".\[\
]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*)*\<(?:(?:\r\n)
?[ \t])*(?:@(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["
()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)
?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>
@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*(?:,@(?:(?:\r\n)?[
\t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,
;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?:\.(?:(?:\r\n)?[ \t]
)*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\
".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*)*:(?:(?:\r\n)?[ \t])*)?
(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\["()<>@,;:\\".
\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])*)(?:\.(?:(?:
\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z|(?=[\[
"()<>@,;:\\".\[\]]))|"(?:[^\"\r\\]|\\.|(?:(?:\r\n)?[ \t]))*"(?:(?:\r\n)?[ \t])
*))*@(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])
+|\Z|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*)(?:\
.(?:(?:\r\n)?[ \t])*(?:[^()<>@,;:\\".\[\] \000-\031]+(?:(?:(?:\r\n)?[ \t])+|\Z
|(?=[\["()<>@,;:\\".\[\]]))|\[([^\[\]\r\\]|\\.)*\](?:(?:\r\n)?[ \t])*))*\>(?:(
?:\r\n)?[ \t])*))*)?;\s*)
()http://www.ex-parrot.com/~pdw/Mail-RFC822-Address.html) यदि आप कुछ सरल खोज रहे हैं, लेकिन वह सबसे अधिक मान्य ईमेल पते पकड़ लेगा, तो कुछ इस तरह आज़माएँ:
"^[a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+$"
संपादित करें: लिंक से:
यह नियमित अभिव्यक्ति केवल उन पतों को मान्य करेगी जिनके पास कोई टिप्पणी छीनी गई है और उन्हें व्हाट्सएप से बदल दिया गया है (यह मॉड्यूल द्वारा किया गया है)।
[अद्यतन] मैंने ईमेल पते के सत्यापन के बारे में जो कुछ भी मुझे पता है, उसे यहाँ संपादित किया है: http://isemail.info, जो अब न केवल मान्य करता है, बल्कि ईमेल पते की समस्याओं का भी निदान करता है। मैं यहां कई टिप्पणियों से सहमत हूं कि सत्यापन केवल उत्तर का हिस्सा है; पर मेरा निबंध देखेंhttp://isemail.info/about।
is_email () बना हुआ है, जहाँ तक मुझे पता है, एकमात्र सत्यापनकर्ता जो आपको निश्चित रूप से बताएगा कि दिया गया स्ट्रिंग वैध ईमेल पता है या नहीं। मैंने एक नया संस्करण अपलोड किया हैhttp://isemail.info/
मैंने कैल हेंडरसन, डेव चाइल्ड, फिल हैक, डग लोवेल, RFC5322 और RFC 3696 से परीक्षण मामलों को मिलाया। सभी में 275 परीक्षण पते। मैंने इन सभी परीक्षणों को उन सभी निशुल्क सत्यापनकर्ताओं के खिलाफ चलाया, जिन्हें मैं पा सकता था।
मैं इस पृष्ठ को अप-टू-डेट रखने की कोशिश करूंगा क्योंकि लोग अपने सत्यापनकर्ताओं को बढ़ाते हैं। इन परीक्षणों के संकलन में मेरे सहयोग और रचनात्मक आलोचना के मेरे सहयोग के लिए कैल, माइकल, डेव, पॉल और फिल का धन्यवाद ।
लोगों को विशेष रूप से RFC 3696 के खिलाफ इरेटा के बारे में पता होना चाहिए । विहित उदाहरणों में से तीन वास्तव में अमान्य पते हैं। और एक पते की अधिकतम लंबाई 254 या 256 वर्ण है, 320 नहीं ।
प्रति W3C एचटीएमएल 5 कल्पना :
^[a-zA-Z0-9.!#$%&'*+/=?^_`{|}~-]+@[a-zA-Z0-9](?:[a-zA-Z0-9-]{0,61}[a-zA-Z0-9])?(?:\.[a-zA-Z0-9](?:[a-zA-Z0-9-]{0,61}[a-zA-Z0-9])?)*$
प्रसंग:
एक वैध ई-मेल पता एक स्ट्रिंग है जो ABNF उत्पादन […] से मेल खाता है।
नोट: यह आवश्यकता RFC 5322 का एक विलक्षण उल्लंघन है , जो ई-मेल पते के लिए एक वाक्यविन्यास को परिभाषित करता है जो एक साथ बहुत सख्त है ("@" चरित्र से पहले), बहुत अस्पष्ट ("@" चरित्र के बाद), और बहुत ही ढीला। टिप्पणियों, व्हाट्सएप पात्रों और अधिकांश उपयोगकर्ताओं के लिए अपरिचित लोगों में उद्धृत तार) को यहां व्यावहारिक उपयोग के लिए अनुमति देता है।
निम्नलिखित जावास्क्रिप्ट- और पर्ल-संगत नियमित अभिव्यक्ति उपरोक्त परिभाषा का कार्यान्वयन है।
/^[a-zA-Z0-9.!#$%&'*+/=?^_`{|}~-]+@[a-zA-Z0-9](?:[a-zA-Z0-9-]{0,61}[a-zA-Z0-9])?(?:\.[a-zA-Z0-9](?:[a-zA-Z0-9-]{0,61}[a-zA-Z0-9])?)*$/
यह पर्ल 5.10 या नए में आसान है:
/(?(DEFINE)
(?<address> (?&mailbox) | (?&group))
(?<mailbox> (?&name_addr) | (?&addr_spec))
(?<name_addr> (?&display_name)? (?&angle_addr))
(?<angle_addr> (?&CFWS)? < (?&addr_spec) > (?&CFWS)?)
(?<group> (?&display_name) : (?:(?&mailbox_list) | (?&CFWS))? ;
(?&CFWS)?)
(?<display_name> (?&phrase))
(?<mailbox_list> (?&mailbox) (?: , (?&mailbox))*)
(?<addr_spec> (?&local_part) \@ (?&domain))
(?<local_part> (?&dot_atom) | (?"ed_string))
(?<domain> (?&dot_atom) | (?&domain_literal))
(?<domain_literal> (?&CFWS)? \[ (?: (?&FWS)? (?&dcontent))* (?&FWS)?
\] (?&CFWS)?)
(?<dcontent> (?&dtext) | (?"ed_pair))
(?<dtext> (?&NO_WS_CTL) | [\x21-\x5a\x5e-\x7e])
(?<atext> (?&ALPHA) | (?&DIGIT) | [!#\$%&'*+-/=?^_`{|}~])
(?<atom> (?&CFWS)? (?&atext)+ (?&CFWS)?)
(?<dot_atom> (?&CFWS)? (?&dot_atom_text) (?&CFWS)?)
(?<dot_atom_text> (?&atext)+ (?: \. (?&atext)+)*)
(?<text> [\x01-\x09\x0b\x0c\x0e-\x7f])
(?<quoted_pair> \\ (?&text))
(?<qtext> (?&NO_WS_CTL) | [\x21\x23-\x5b\x5d-\x7e])
(?<qcontent> (?&qtext) | (?"ed_pair))
(?<quoted_string> (?&CFWS)? (?&DQUOTE) (?:(?&FWS)? (?&qcontent))*
(?&FWS)? (?&DQUOTE) (?&CFWS)?)
(?<word> (?&atom) | (?"ed_string))
(?<phrase> (?&word)+)
# Folding white space
(?<FWS> (?: (?&WSP)* (?&CRLF))? (?&WSP)+)
(?<ctext> (?&NO_WS_CTL) | [\x21-\x27\x2a-\x5b\x5d-\x7e])
(?<ccontent> (?&ctext) | (?"ed_pair) | (?&comment))
(?<comment> \( (?: (?&FWS)? (?&ccontent))* (?&FWS)? \) )
(?<CFWS> (?: (?&FWS)? (?&comment))*
(?: (?:(?&FWS)? (?&comment)) | (?&FWS)))
# No whitespace control
(?<NO_WS_CTL> [\x01-\x08\x0b\x0c\x0e-\x1f\x7f])
(?<ALPHA> [A-Za-z])
(?<DIGIT> [0-9])
(?<CRLF> \x0d \x0a)
(?<DQUOTE> ")
(?<WSP> [\x20\x09])
)
(?&address)/x
मैं उपयोग करता हूं
^\w+([-+.']\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
कौन से ASP.NET में RegularExpressionValidator द्वारा उपयोग किया जाता है।
सर्वश्रेष्ठ के बारे में नहीं जानते, लेकिन यह कम से कम सही है, जब तक कि पते उनकी टिप्पणियों को हटा दिए गए हैं और उन्हें व्हाट्सएप से बदल दिया गया है।
गंभीरता से। ईमेल को मान्य करने के लिए आपको पहले से ही लिखित पुस्तकालय का उपयोग करना चाहिए। सबसे अच्छा तरीका शायद उस पते पर एक सत्यापन ई-मेल भेजना है।
जिन ईमेल पतों को मैं मान्य करना चाहता हूं, वे ASP.NET वेब एप्लिकेशन द्वारा System.Net.Mail
लोगों की सूची में ईमेल भेजने के लिए नामस्थान का उपयोग करने वाले हैं।
इसलिए, कुछ बहुत ही जटिल नियमित अभिव्यक्ति का उपयोग करने के बजाय, मैं सिर्फ MailAddress
पते से एक उदाहरण बनाने की कोशिश करता हूं । MailAddress
अगर पता ठीक से नहीं बनाया गया है निर्माता एक अपवाद फेंक देते हैं। इस तरह, मुझे पता है कि मैं कम से कम दरवाजे से ईमेल प्राप्त कर सकता हूं। बेशक यह सर्वर-साइड सत्यापन है, लेकिन कम से कम आपको वैसे भी इसकी आवश्यकता है।
protected void emailValidator_ServerValidate(object source, ServerValidateEventArgs args)
{
try
{
var a = new MailAddress(txtEmail.Text);
}
catch (Exception ex)
{
args.IsValid = false;
emailValidator.ErrorMessage = "email: " + ex.Message;
}
}
शीघ्र जवाब
इनपुट सत्यापन के लिए निम्नलिखित रेगेक्स का उपयोग करें:
([-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*|"([]!#-[^-~ \t]|(\\[\t -~]))+")@[0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?(\.[0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?)+
इस regex द्वारा मिलान किए गए पते:
- एक स्थानीय हिस्सा (यानी @ -साइन से पहले वाला हिस्सा) जो RFC 5321/5322 के साथ सख्ती से अनुपालन करता है,
- एक डोमेन हिस्सा (यानी @ -sign के बाद का हिस्सा) कम से कम दो लेबल के साथ एक होस्ट नाम है, जिनमें से प्रत्येक में सबसे अधिक 63 अक्षर लंबे हैं।
दूसरा बाधा RFC 5321/5322 पर प्रतिबंध है।
विस्तृत उत्तर
ईमेल पतों को पहचानने वाली एक नियमित अभिव्यक्ति का उपयोग करना विभिन्न स्थितियों में उपयोगी हो सकता है: उदाहरण के लिए किसी दस्तावेज़ में ईमेल पतों को स्कैन करने के लिए, उपयोगकर्ता इनपुट को मान्य करने के लिए, या डेटा रिपॉजिटरी में एक अखंडता बाधा के रूप में।
हालांकि यह ध्यान दिया जाना चाहिए कि यदि आप यह पता लगाना चाहते हैं कि क्या पता वास्तव में मौजूदा मेलबॉक्स को संदर्भित करता है, तो पते पर संदेश भेजने के लिए कोई विकल्प नहीं है। यदि आप केवल यह जांचना चाहते हैं कि क्या कोई पता व्याकरणिक रूप से सही है तो आप एक नियमित अभिव्यक्ति का उपयोग कर सकते हैं, लेकिन ध्यान दें कि ""@[]
एक व्याकरणिक रूप से सही ईमेल पता है जो निश्चित रूप से मौजूदा मेलबॉक्स का संदर्भ नहीं देता है।
ईमेल पते के वाक्य-विन्यास को विभिन्न RFC में परिभाषित किया गया है , विशेष रूप से RFC 822 और RFC 5322 । RFC 822 को "मूल" मानक और RFC 5322 को नवीनतम मानक के रूप में देखा जाना चाहिए। RFC 822 में परिभाषित सिंटैक्स सबसे उदार है और बाद के मानकों ने सिंटैक्स को आगे और आगे प्रतिबंधित कर दिया है, जहां नई प्रणालियों या सेवाओं को अप्रचलित सिंटैक्स को पहचानना चाहिए, लेकिन इसे कभी उत्पन्न नहीं करना चाहिए।
इस उत्तर में मैं addr-spec
RFC में परिभाषित (मतलब [email protected]
, लेकिन नहीं "John Doe"<[email protected]>
, न ही some-group:[email protected],[email protected];
) के रूप में "ईमेल पता" ले जाऊंगा ।
RFC सिंटैक्स को regexes में अनुवाद करने में एक समस्या है: सिंटैक्स नियमित नहीं होते हैं! ऐसा इसलिए है क्योंकि वे ईमेल पतों में वैकल्पिक टिप्पणियों के लिए अनुमति देते हैं जो असीम रूप से नेस्टेड हो सकते हैं, जबकि अनंत नेस्टिंग को एक नियमित अभिव्यक्ति द्वारा वर्णित नहीं किया जा सकता है। उन टिप्पणियों के लिए स्कैन या मान्य करने के लिए जिन्हें आपको पार्सर या अधिक शक्तिशाली अभिव्यक्तियों की आवश्यकता है। (ध्यान दें कि पर्ल जैसी भाषाओं में संदर्भ मुक्त व्याकरणों का एक रेक्सक्स की तरह वर्णन करने के लिए निर्माण होता है।) इस उत्तर में मैं टिप्पणियों की अवहेलना करूंगा और केवल उचित नियमित भावों पर विचार करूंगा।
RFC ईमेल संदेशों के लिए वाक्यविन्यास को परिभाषित करता है, ईमेल पते के लिए नहीं। पते विभिन्न हेडर फ़ील्ड में दिखाई दे सकते हैं और यह वह जगह है जहाँ वे मुख्य रूप से परिभाषित होते हैं। जब वे हेडर फ़ील्ड में दिखाई देते हैं तो पते (लेक्सिकल टोकन के बीच) व्हाट्सएप, टिप्पणियां और यहां तक कि लाइनब्रेक हो सकते हैं। शब्दार्थ इसका कोई महत्व नहीं है। इस व्हाट्सएप इत्यादि को एक पते से हटाकर, आप एक शब्दार्थ रूप से समकक्ष कैनोनिकल प्रतिनिधित्व प्राप्त करते हैं । इस प्रकार, विहित प्रतिनिधित्व first. last (comment) @ [3.5.7.9]
है first.last@[3.5.7.9]
।
विभिन्न उद्देश्यों के लिए अलग-अलग वाक्यविन्यास का उपयोग किया जाना चाहिए। यदि आप (संभवतः बहुत पुराने) दस्तावेज़ में ईमेल पते के लिए स्कैन करना चाहते हैं, तो यह RFC 822 में परिभाषित सिंटैक्स का उपयोग करने के लिए एक अच्छा विचार हो सकता है। दूसरी ओर, यदि आप उपयोगकर्ता इनपुट को मान्य करना चाहते हैं, तो आप इसका उपयोग करना चाहते हैं। RFC 5322 में परिभाषित सिंटैक्स, शायद केवल कैनोनिकल अभ्यावेदन स्वीकार कर रहा है। आपको तय करना चाहिए कि आपके विशिष्ट मामले में कौन सा वाक्यविन्यास लागू होता है।
मैं इस जवाब में ASCII संगत वर्ण सेट मानकर POSIX "विस्तारित" नियमित अभिव्यक्तियों का उपयोग करता हूं।
आरएफसी 822
मैं निम्नलिखित नियमित अभिव्यक्ति पर पहुंचा। मैं सभी को कोशिश करने और इसे तोड़ने के लिए आमंत्रित करता हूं। यदि आपको कोई झूठी सकारात्मक या गलत नकारात्मक मिलती है, तो कृपया उन्हें एक टिप्पणी में पोस्ट करें और मैं जल्द से जल्द अभिव्यक्ति को ठीक करने की कोशिश करूंगा।
([^][()<>@,;:\\". \x00-\x1F\x7F]+|"(\n|(\\\r)*([^"\\\r\n]|\\[^\r]))*(\\\r)*")(\.([^][()<>@,;:\\". \x00-\x1F\x7F]+|"(\n|(\\\r)*([^"\\\r\n]|\\[^\r]))*(\\\r)*"))*@([^][()<>@,;:\\". \x00-\x1F\x7F]+|\[(\n|(\\\r)*([^][\\\r\n]|\\[^\r]))*(\\\r)*])(\.([^][()<>@,;:\\". \x00-\x1F\x7F]+|\[(\n|(\\\r)*([^][\\\r\n]|\\[^\r]))*(\\\r)*]))*
मेरा मानना है कि यह इरेटा सहित RFC 822 के साथ पूरी तरह से अनुकूल है । यह केवल ईमेल पते को उनके विहित रूप में पहचानता है। एक regex के लिए जो पहचानता है (तह) व्हाट्सएप नीचे व्युत्पत्ति देखता है।
व्युत्पत्ति से पता चलता है कि मैं अभिव्यक्ति में कैसे आया। मैं RFC से सभी प्रासंगिक व्याकरण नियमों को सूचीबद्ध करता हूं, जैसा कि वे दिखाई देते हैं, उसके बाद संबंधित रेगेक्स। जहां एक इरेटा प्रकाशित किया गया है मैं सही व्याकरण नियम ("इरेटम" के रूप में चिह्नित) के लिए एक अलग अभिव्यक्ति देता हूं और बाद के नियमित अभिव्यक्तियों में अपडेट किए गए संस्करण को सब-डेप्रिसिएशन के रूप में उपयोग करता हूं।
जैसा कि अनुच्छेद 3.1.4 में कहा गया है। RFC 822 वैकल्पिक रैखिक सफेद स्थान को लेक्सिकल टोकन के बीच डाला जा सकता है। जहां लागू हो, मैंने इस नियम को समायोजित करने के लिए भावों का विस्तार किया है और "ऑप्ट-lwsp" के साथ परिणाम को चिह्नित किया है।
CHAR = <any ASCII character>
=~ .
CTL = <any ASCII control character and DEL>
=~ [\x00-\x1F\x7F]
CR = <ASCII CR, carriage return>
=~ \r
LF = <ASCII LF, linefeed>
=~ \n
SPACE = <ASCII SP, space>
=~
HTAB = <ASCII HT, horizontal-tab>
=~ \t
<"> = <ASCII quote mark>
=~ "
CRLF = CR LF
=~ \r\n
LWSP-char = SPACE / HTAB
=~ [ \t]
linear-white-space = 1*([CRLF] LWSP-char)
=~ ((\r\n)?[ \t])+
specials = "(" / ")" / "<" / ">" / "@" / "," / ";" / ":" / "\" / <"> / "." / "[" / "]"
=~ [][()<>@,;:\\".]
quoted-pair = "\" CHAR
=~ \\.
qtext = <any CHAR excepting <">, "\" & CR, and including linear-white-space>
=~ [^"\\\r]|((\r\n)?[ \t])+
dtext = <any CHAR excluding "[", "]", "\" & CR, & including linear-white-space>
=~ [^][\\\r]|((\r\n)?[ \t])+
quoted-string = <"> *(qtext|quoted-pair) <">
=~ "([^"\\\r]|((\r\n)?[ \t])|\\.)*"
(erratum) =~ "(\n|(\\\r)*([^"\\\r\n]|\\[^\r]|(\r\n)?[ \t]))*(\\\r)*"
domain-literal = "[" *(dtext|quoted-pair) "]"
=~ \[([^][\\\r]|((\r\n)?[ \t])|\\.)*]
(erratum) =~ \[(\n|(\\\r)*([^][\\\r\n]|\\[^\r]|(\r\n)?[ \t]))*(\\\r)*]
atom = 1*<any CHAR except specials, SPACE and CTLs>
=~ [^][()<>@,;:\\". \x00-\x1F\x7F]+
word = atom / quoted-string
=~ [^][()<>@,;:\\". \x00-\x1F\x7F]+|"(\n|(\\\r)*([^"\\\r\n]|\\[^\r]|(\r\n)?[ \t]))*(\\\r)*"
domain-ref = atom
sub-domain = domain-ref / domain-literal
=~ [^][()<>@,;:\\". \x00-\x1F\x7F]+|\[(\n|(\\\r)*([^][\\\r\n]|\\[^\r]|(\r\n)?[ \t]))*(\\\r)*]
local-part = word *("." word)
=~ ([^][()<>@,;:\\". \x00-\x1F\x7F]+|"(\n|(\\\r)*([^"\\\r\n]|\\[^\r]|(\r\n)?[ \t]))*(\\\r)*")(\.([^][()<>@,;:\\". \x00-\x1F\x7F]+|"(\n|(\\\r)*([^"\\\r\n]|\\[^\r]|(\r\n)?[ \t]))*(\\\r)*"))*
(opt-lwsp) =~ ([^][()<>@,;:\\". \x00-\x1F\x7F]+|"(\n|(\\\r)*([^"\\\r\n]|\\[^\r]|(\r\n)?[ \t]))*(\\\r)*")(((\r\n)?[ \t])*\.((\r\n)?[ \t])*([^][()<>@,;:\\". \x00-\x1F\x7F]+|"(\n|(\\\r)*([^"\\\r\n]|\\[^\r]|(\r\n)?[ \t]))*(\\\r)*"))*
domain = sub-domain *("." sub-domain)
=~ ([^][()<>@,;:\\". \x00-\x1F\x7F]+|\[(\n|(\\\r)*([^][\\\r\n]|\\[^\r]|(\r\n)?[ \t]))*(\\\r)*])(\.([^][()<>@,;:\\". \x00-\x1F\x7F]+|\[(\n|(\\\r)*([^][\\\r\n]|\\[^\r]|(\r\n)?[ \t]))*(\\\r)*]))*
(opt-lwsp) =~ ([^][()<>@,;:\\". \x00-\x1F\x7F]+|\[(\n|(\\\r)*([^][\\\r\n]|\\[^\r]|(\r\n)?[ \t]))*(\\\r)*])(((\r\n)?[ \t])*\.((\r\n)?[ \t])*([^][()<>@,;:\\". \x00-\x1F\x7F]+|\[(\n|(\\\r)*([^][\\\r\n]|\\[^\r]|(\r\n)?[ \t]))*(\\\r)*]))*
addr-spec = local-part "@" domain
=~ ([^][()<>@,;:\\". \x00-\x1F\x7F]+|"(\n|(\\\r)*([^"\\\r\n]|\\[^\r]|(\r\n)?[ \t]))*(\\\r)*")(\.([^][()<>@,;:\\". \x00-\x1F\x7F]+|"(\n|(\\\r)*([^"\\\r\n]|\\[^\r]|(\r\n)?[ \t]))*(\\\r)*"))*@([^][()<>@,;:\\". \x00-\x1F\x7F]+|\[(\n|(\\\r)*([^][\\\r\n]|\\[^\r]|(\r\n)?[ \t]))*(\\\r)*])(\.([^][()<>@,;:\\". \x00-\x1F\x7F]+|\[(\n|(\\\r)*([^][\\\r\n]|\\[^\r]|(\r\n)?[ \t]))*(\\\r)*]))*
(opt-lwsp) =~ ([^][()<>@,;:\\". \x00-\x1F\x7F]+|"(\n|(\\\r)*([^"\\\r\n]|\\[^\r]|(\r\n)?[ \t]))*(\\\r)*")((\r\n)?[ \t])*(\.((\r\n)?[ \t])*([^][()<>@,;:\\". \x00-\x1F\x7F]+|"(\n|(\\\r)*([^"\\\r\n]|\\[^\r]|(\r\n)?[ \t]))*(\\\r)*")((\r\n)?[ \t])*)*@((\r\n)?[ \t])*([^][()<>@,;:\\". \x00-\x1F\x7F]+|\[(\n|(\\\r)*([^][\\\r\n]|\\[^\r]|(\r\n)?[ \t]))*(\\\r)*])(((\r\n)?[ \t])*\.((\r\n)?[ \t])*([^][()<>@,;:\\". \x00-\x1F\x7F]+|\[(\n|(\\\r)*([^][\\\r\n]|\\[^\r]|(\r\n)?[ \t]))*(\\\r)*]))*
(canonical) =~ ([^][()<>@,;:\\". \x00-\x1F\x7F]+|"(\n|(\\\r)*([^"\\\r\n]|\\[^\r]))*(\\\r)*")(\.([^][()<>@,;:\\". \x00-\x1F\x7F]+|"(\n|(\\\r)*([^"\\\r\n]|\\[^\r]))*(\\\r)*"))*@([^][()<>@,;:\\". \x00-\x1F\x7F]+|\[(\n|(\\\r)*([^][\\\r\n]|\\[^\r]))*(\\\r)*])(\.([^][()<>@,;:\\". \x00-\x1F\x7F]+|\[(\n|(\\\r)*([^][\\\r\n]|\\[^\r]))*(\\\r)*]))*
RFC 5322
मैं निम्नलिखित नियमित अभिव्यक्ति पर पहुंचा। मैं सभी को कोशिश करने और इसे तोड़ने के लिए आमंत्रित करता हूं। यदि आपको कोई झूठी सकारात्मक या गलत नकारात्मक मिलती है, तो कृपया उन्हें एक टिप्पणी में पोस्ट करें और मैं जल्द से जल्द अभिव्यक्ति को ठीक करने की कोशिश करूंगा।
([-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*|"([]!#-[^-~ \t]|(\\[\t -~]))+")@([-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*|\[[\t -Z^-~]*])
मेरा मानना है कि यह इरेटा सहित RFC 5322 के साथ पूरी तरह से अनुकूल है । यह केवल ईमेल पते को उनके विहित रूप में पहचानता है। एक regex के लिए जो पहचानता है (तह) व्हाट्सएप नीचे व्युत्पत्ति देखता है।
व्युत्पत्ति से पता चलता है कि मैं अभिव्यक्ति में कैसे आया। मैं RFC से सभी प्रासंगिक व्याकरण नियमों को सूचीबद्ध करता हूं, जैसा कि वे दिखाई देते हैं, उसके बाद संबंधित रेगेक्स। ऐसे नियमों के लिए जिनमें शब्दशः अप्रासंगिक (फोल्डिंग) व्हाट्सएप शामिल है, मैं एक अलग रेग्क्स चिह्नित "(सामान्यीकृत)" देता हूं जो इस व्हाट्सएप को स्वीकार नहीं करता है।
मैंने RFC के सभी "अवलोकन" नियमों को अनदेखा किया। इसका मतलब यह है कि रेग्जेस केवल उन ईमेल पतों से मेल खाते हैं जो RFC 5322 के अनुरूप हैं। यदि आपको "पुराने" पतों ("जुनूनी" नियमों सहित शिथिल व्याकरण के रूप में मेल खाना है), तो आप पिछले पैराग्राफ से RFC 822 रेगेक्स में से एक का उपयोग कर सकते हैं।
VCHAR = %x21-7E
=~ [!-~]
ALPHA = %x41-5A / %x61-7A
=~ [A-Za-z]
DIGIT = %x30-39
=~ [0-9]
HTAB = %x09
=~ \t
CR = %x0D
=~ \r
LF = %x0A
=~ \n
SP = %x20
=~
DQUOTE = %x22
=~ "
CRLF = CR LF
=~ \r\n
WSP = SP / HTAB
=~ [\t ]
quoted-pair = "\" (VCHAR / WSP)
=~ \\[\t -~]
FWS = ([*WSP CRLF] 1*WSP)
=~ ([\t ]*\r\n)?[\t ]+
ctext = %d33-39 / %d42-91 / %d93-126
=~ []!-'*-[^-~]
("comment" is left out in the regex)
ccontent = ctext / quoted-pair / comment
=~ []!-'*-[^-~]|(\\[\t -~])
(not regular)
comment = "(" *([FWS] ccontent) [FWS] ")"
(is equivalent to FWS when leaving out comments)
CFWS = (1*([FWS] comment) [FWS]) / FWS
=~ ([\t ]*\r\n)?[\t ]+
atext = ALPHA / DIGIT / "!" / "#" / "$" / "%" / "&" / "'" / "*" / "+" / "-" / "/" / "=" / "?" / "^" / "_" / "`" / "{" / "|" / "}" / "~"
=~ [-!#-'*+/-9=?A-Z^-~]
dot-atom-text = 1*atext *("." 1*atext)
=~ [-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*
dot-atom = [CFWS] dot-atom-text [CFWS]
=~ (([\t ]*\r\n)?[\t ]+)?[-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*(([\t ]*\r\n)?[\t ]+)?
(normalized) =~ [-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*
qtext = %d33 / %d35-91 / %d93-126
=~ []!#-[^-~]
qcontent = qtext / quoted-pair
=~ []!#-[^-~]|(\\[\t -~])
(erratum)
quoted-string = [CFWS] DQUOTE ((1*([FWS] qcontent) [FWS]) / FWS) DQUOTE [CFWS]
=~ (([\t ]*\r\n)?[\t ]+)?"(((([\t ]*\r\n)?[\t ]+)?([]!#-[^-~]|(\\[\t -~])))+(([\t ]*\r\n)?[\t ]+)?|(([\t ]*\r\n)?[\t ]+)?)"(([\t ]*\r\n)?[\t ]+)?
(normalized) =~ "([]!#-[^-~ \t]|(\\[\t -~]))+"
dtext = %d33-90 / %d94-126
=~ [!-Z^-~]
domain-literal = [CFWS] "[" *([FWS] dtext) [FWS] "]" [CFWS]
=~ (([\t ]*\r\n)?[\t ]+)?\[((([\t ]*\r\n)?[\t ]+)?[!-Z^-~])*(([\t ]*\r\n)?[\t ]+)?](([\t ]*\r\n)?[\t ]+)?
(normalized) =~ \[[\t -Z^-~]*]
local-part = dot-atom / quoted-string
=~ (([\t ]*\r\n)?[\t ]+)?[-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*(([\t ]*\r\n)?[\t ]+)?|(([\t ]*\r\n)?[\t ]+)?"(((([\t ]*\r\n)?[\t ]+)?([]!#-[^-~]|(\\[\t -~])))+(([\t ]*\r\n)?[\t ]+)?|(([\t ]*\r\n)?[\t ]+)?)"(([\t ]*\r\n)?[\t ]+)?
(normalized) =~ [-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*|"([]!#-[^-~ \t]|(\\[\t -~]))+"
domain = dot-atom / domain-literal
=~ (([\t ]*\r\n)?[\t ]+)?[-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*(([\t ]*\r\n)?[\t ]+)?|(([\t ]*\r\n)?[\t ]+)?\[((([\t ]*\r\n)?[\t ]+)?[!-Z^-~])*(([\t ]*\r\n)?[\t ]+)?](([\t ]*\r\n)?[\t ]+)?
(normalized) =~ [-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*|\[[\t -Z^-~]*]
addr-spec = local-part "@" domain
=~ ((([\t ]*\r\n)?[\t ]+)?[-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*(([\t ]*\r\n)?[\t ]+)?|(([\t ]*\r\n)?[\t ]+)?"(((([\t ]*\r\n)?[\t ]+)?([]!#-[^-~]|(\\[\t -~])))+(([\t ]*\r\n)?[\t ]+)?|(([\t ]*\r\n)?[\t ]+)?)"(([\t ]*\r\n)?[\t ]+)?)@((([\t ]*\r\n)?[\t ]+)?[-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*(([\t ]*\r\n)?[\t ]+)?|(([\t ]*\r\n)?[\t ]+)?\[((([\t ]*\r\n)?[\t ]+)?[!-Z^-~])*(([\t ]*\r\n)?[\t ]+)?](([\t ]*\r\n)?[\t ]+)?)
(normalized) =~ ([-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*|"([]!#-[^-~ \t]|(\\[\t -~]))+")@([-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*|\[[\t -Z^-~]*])
ध्यान दें कि कुछ स्रोत (विशेष रूप से w3c ) का दावा है कि RFC 5322 स्थानीय भाग (यानी @ -साइन से पहले वाला हिस्सा) पर बहुत सख्त है। ऐसा इसलिए है क्योंकि "..", "ए .. बी" और "ए।" हैं न वैध डॉट परमाणुओं, जबकि वे मेलबॉक्स नाम के रूप में इस्तेमाल किया जा सकता है। आरएफसी, तथापि, करता है इस तरह के स्थानीय भागों के लिए अनुमति देते हैं, सिवाय इसके कि वे उद्धृत किया जाना करने के लिए है। इसलिए इसके बजाय [email protected]
आपको लिखना चाहिए "a..b"@example.net
, जो शब्दार्थ के बराबर है।
आगे प्रतिबंध
SMTP ( RFC 5321 में परिभाषित ) आगे मान्य ईमेल पतों (या वास्तव में: मेलबॉक्स नाम) के सेट को प्रतिबंधित करता है। इस कड़े व्याकरण को थोपना उचित प्रतीत होता है, ताकि मेल किए गए ईमेल पते का उपयोग वास्तव में ईमेल भेजने के लिए किया जा सके।
RFC 5321 मूल रूप से "स्थानीय" भाग (यानी @ -sign से पहले वाला हिस्सा) को छोड़ देता है, लेकिन डोमेन भाग (यानी @ -sign के बाद वाला भाग) पर कठोर है। यह केवल डोमेन नाम के स्थान पर डॉट-एटम्स और एड्रेस लिटरल के स्थान पर होस्ट नाम की अनुमति देता है।
RFC 5321 में प्रस्तुत व्याकरण तब बहुत हल्का होता है जब यह होस्ट नाम और IP पते दोनों के लिए आता है। मैंने इस ड्राफ्ट और RFC 1034 को दिशा-निर्देशों के रूप में उपयोग करते हुए, नियमों को "सही" करने की स्वतंत्रता ली । यहाँ परिणामी रेगेक्स है।
([-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*|"([]!#-[^-~ \t]|(\\[\t -~]))+")@([0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?(\.[0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?)*|\[((25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3}|IPv6:((((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){6}|::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){5}|[0-9A-Fa-f]{0,4}::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){4}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):)?(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){3}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,2}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){2}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,3}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,4}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::)((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3})|(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3})|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,5}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3})|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,6}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::)|(?!IPv6:)[0-9A-Za-z-]*[0-9A-Za-z]:[!-Z^-~]+)])
ध्यान दें कि उपयोग के मामले के आधार पर आप अपने रेगेक्स में "सामान्य-पता-शाब्दिक" के लिए अनुमति नहीं देना चाह सकते हैं। यह भी ध्यान दें कि मैंने (?!IPv6:)
विकृत आईपीवी 6 पतों से मिलान करने के लिए "सामान्य-पता-शाब्दिक" भाग को रोकने के लिए अंतिम रेगेक्स में एक नकारात्मक रूपांतर का उपयोग किया था। कुछ रेगेक्स प्रोसेसर नकारात्मक लुकहेड का समर्थन नहीं करते हैं। |(?!IPv6:)[0-9A-Za-z-]*[0-9A-Za-z]:[!-Z^-~]+
यदि आप संपूर्ण "सामान्य-पता-शाब्दिक" भाग को बाहर निकालना चाहते हैं, तो रेगेक्स से सबस्ट्रिंग निकालें ।
यहाँ व्युत्पत्ति है:
Let-dig = ALPHA / DIGIT
=~ [0-9A-Za-z]
Ldh-str = *( ALPHA / DIGIT / "-" ) Let-dig
=~ [0-9A-Za-z-]*[0-9A-Za-z]
(regex is updated to make sure sub-domains are max. 63 charactes long - RFC 1034 section 3.5)
sub-domain = Let-dig [Ldh-str]
=~ [0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?
Domain = sub-domain *("." sub-domain)
=~ [0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?(\.[0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?)*
Snum = 1*3DIGIT
=~ [0-9]{1,3}
(suggested replacement for "Snum")
ip4-octet = DIGIT / %x31-39 DIGIT / "1" 2DIGIT / "2" %x30-34 DIGIT / "25" %x30-35
=~ 25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9]
IPv4-address-literal = Snum 3("." Snum)
=~ [0-9]{1,3}(\.[0-9]{1,3}){3}
(suggested replacement for "IPv4-address-literal")
ip4-address = ip4-octet 3("." ip4-octet)
=~ (25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3}
(suggested replacement for "IPv6-hex")
ip6-h16 = "0" / ( (%x49-57 / %x65-70 /%x97-102) 0*3(%x48-57 / %x65-70 /%x97-102) )
=~ 0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}
(not from RFC)
ls32 = ip6-h16 ":" ip6-h16 / ip4-address
=~ (0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3})|(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3}
(suggested replacement of "IPv6-addr")
ip6-address = 6(ip6-h16 ":") ls32
/ "::" 5(ip6-h16 ":") ls32
/ [ ip6-h16 ] "::" 4(ip6-h16 ":") ls32
/ [ *1(ip6-h16 ":") ip6-h16 ] "::" 3(ip6-h16 ":") ls32
/ [ *2(ip6-h16 ":") ip6-h16 ] "::" 2(ip6-h16 ":") ls32
/ [ *3(ip6-h16 ":") ip6-h16 ] "::" ip6-h16 ":" ls32
/ [ *4(ip6-h16 ":") ip6-h16 ] "::" ls32
/ [ *5(ip6-h16 ":") ip6-h16 ] "::" ip6-h16
/ [ *6(ip6-h16 ":") ip6-h16 ] "::"
=~ (((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){6}|::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){5}|[0-9A-Fa-f]{0,4}::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){4}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):)?(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){3}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,2}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){2}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,3}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,4}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::)((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3})|(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3})|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,5}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3})|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,6}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::
IPv6-address-literal = "IPv6:" ip6-address
=~ IPv6:((((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){6}|::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){5}|[0-9A-Fa-f]{0,4}::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){4}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):)?(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){3}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,2}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){2}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,3}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,4}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::)((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3})|(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3})|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,5}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3})|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,6}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::)
Standardized-tag = Ldh-str
=~ [0-9A-Za-z-]*[0-9A-Za-z]
dcontent = %d33-90 / %d94-126
=~ [!-Z^-~]
General-address-literal = Standardized-tag ":" 1*dcontent
=~ [0-9A-Za-z-]*[0-9A-Za-z]:[!-Z^-~]+
address-literal = "[" ( IPv4-address-literal / IPv6-address-literal / General-address-literal ) "]"
=~ \[((25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3}|IPv6:((((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){6}|::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){5}|[0-9A-Fa-f]{0,4}::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){4}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):)?(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){3}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,2}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){2}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,3}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,4}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::)((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3})|(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3})|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,5}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3})|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,6}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::)|(?!IPv6:)[0-9A-Za-z-]*[0-9A-Za-z]:[!-Z^-~]+)]
Mailbox = Local-part "@" ( Domain / address-literal )
=~ ([-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*|"([]!#-[^-~ \t]|(\\[\t -~]))+")@([0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?(\.[0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?)*|\[((25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3}|IPv6:((((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){6}|::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){5}|[0-9A-Fa-f]{0,4}::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){4}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):)?(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){3}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,2}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){2}|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,3}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,4}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::)((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3})|(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3})|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,5}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3})|(((0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}):){0,6}(0|[1-9A-Fa-f][0-9A-Fa-f]{0,3}))?::)|(?!IPv6:)[0-9A-Za-z-]*[0-9A-Za-z]:[!-Z^-~]+)])
उपयोगकर्ता इनपुट सत्यापन
एक सामान्य उपयोग का मामला उपयोगकर्ता इनपुट सत्यापन है, उदाहरण के लिए HTML फॉर्म। उस स्थिति में यह आमतौर पर पता-शाब्दिकों को छोड़ने और होस्टनाम में कम से कम दो लेबल लगाने के लिए उचित है। एक आधार के रूप में पिछले भाग से बेहतर RFC 5321 रेक्सक्स लेते हुए, परिणामी अभिव्यक्ति होगी:
([-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*|"([]!#-[^-~ \t]|(\\[\t -~]))+")@[0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?(\.[0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?)+
मैं स्थानीय भाग को आगे प्रतिबंधित करने की सलाह नहीं देता, उदाहरण के लिए, उद्धृत स्ट्रिंग्स को छोड़कर, क्योंकि हम नहीं जानते कि किस प्रकार के मेलबॉक्स कुछ मेजबान को अनुमति देते हैं (जैसे "a..b"@example.net
या भी "a b"@example.net
)।
मैं शाब्दिक शीर्ष-स्तरीय डोमेन की सूची के खिलाफ या यहां तक कि लंबाई-बाधाओं को भी स्पष्ट रूप से सत्यापित करने की अनुशंसा नहीं करता हूं (याद रखें कि ".museum" अमान्य कैसे हुआ [a-z]{2,4}
), लेकिन यदि आपको:
([-!#-'*+/-9=?A-Z^-~]+(\.[-!#-'*+/-9=?A-Z^-~]+)*|"([]!#-[^-~ \t]|(\\[\t -~]))+")@([0-9A-Za-z]([0-9A-Za-z-]{0,61}[0-9A-Za-z])?\.)*(net|org|com|info|
आदि...)
यदि आप स्पष्ट शीर्ष-स्तरीय डोमेन सत्यापन के पथ से नीचे जाने का निर्णय लेते हैं, तो अपने regex को अद्यतित रखना सुनिश्चित करें।
आगे के विचार
जब केवल डोमेन भाग (@ -sign के बाद) में होस्ट नामों को स्वीकार करते हैं, तो ऊपर के रेगीक्स केवल 63 अक्षरों के साथ ही लेबल स्वीकार करते हैं, जैसा कि उन्हें करना चाहिए। हालांकि, वे इस तथ्य को लागू नहीं करते हैं कि पूरे मेजबान का नाम अधिकतम 253 वर्ण (डॉट्स सहित) लंबा होना चाहिए। यद्यपि यह बाधा अभी भी नियमित रूप से कड़ाई से बोल रही है, लेकिन इस नियम को शामिल करने वाले रेगेक्स बनाने के लिए संभव नहीं है।
एक और विचार, विशेष रूप से इनपुट सत्यापन के लिए रेग्जेस का उपयोग करते समय, उपयोगकर्ता की प्रतिक्रिया है। यदि कोई उपयोगकर्ता किसी गलत पते पर प्रवेश करता है, तो एक "सरल वाक्यगत पते" की तुलना में थोड़ी अधिक प्रतिक्रिया देना अच्छा होगा। "वेनिला" के साथ यह संभव नहीं है।
पते पर विचार करके इन दो बातों पर ध्यान दिया जा सकता है। मेजबान नामों पर अतिरिक्त लंबाई की बाधा कुछ मामलों में एक अतिरिक्त रेगेक्स का उपयोग करके भी पता की जा सकती है जो इसे जांचता है, और दोनों अभिव्यक्तियों के खिलाफ पते का मिलान करता है।
इस उत्तर में कोई भी प्रतिक्षेप प्रदर्शन के लिए अनुकूलित नहीं है। यदि प्रदर्शन एक समस्या है, तो आपको यह देखना चाहिए कि क्या (और कैसे) आपकी पसंद का rexx अनुकूलित किया जा सकता है।
नेट पर इसके बहुत सारे उदाहरण हैं (और मुझे लगता है कि एक भी ऐसा है जो आरएफसी को पूरी तरह से मान्य करता है - लेकिन यह दसियों / सैकड़ों लाइनें लंबी है अगर मेमोरी काम करती है)। लोग इस तरह की बात को मान्य करने से पीछे हट जाते हैं। क्यों नहीं जाँच करें कि यह एक @ और कम से कम एक है। और कुछ सरल न्यूनतम लंबाई को पूरा करता है। यह एक नकली ईमेल दर्ज करने के लिए तुच्छ है और फिर भी किसी भी वैध रेगेक्स से मेल खाता है। मुझे लगता है कि झूठी सकारात्मक गलत नकारात्मक से बेहतर हैं।
यह तय करते समय कि कौन से वर्णों की अनुमति है, कृपया अपने उदासीन और हाइफ़न दोस्तों को याद रखें। मेरा इस तथ्य पर कोई नियंत्रण नहीं है कि मेरी कंपनी एचआर सिस्टम से मेरे नाम का उपयोग करके अपना ईमेल पता बनाती है। इसमें मेरे अंतिम नाम में धर्मोपदेश शामिल है। मैं आपको यह नहीं बता सकता कि कितनी बार मुझे एक वेबसाइट के साथ बातचीत करने से रोका गया है कि मेरा ईमेल पता "अमान्य" है।
यह रेगेक्स पर्ल के ईमेल :: मान्य पुस्तकालय से है। मेरा मानना है कि यह सबसे सटीक है, यह सभी 822 से मेल खाता है। और, यह ओ'रेली में नियमित अभिव्यक्ति पर आधारित है:
नियमित अभिव्यक्ति में जेफरी फ़्रिड्ल के उदाहरण का उपयोग करके बनाया रेगुलर एक्सप्रेशन मास्टरिंग (http://www.ora.com/catalog/regexp/) है।
$RFC822PAT = <<'EOF';
[\040\t]*(?:\([^\\\x80-\xff\n\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\
xff\n\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff\n\015()]*)*\))[^\\\x80-\xf
f\n\015()]*)*\)[\040\t]*)*(?:(?:[^(\040)<>@,;:".\\\[\]\000-\037\x80-\x
ff]+(?![^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff])|"[^\\\x80-\xff\n\015
"]*(?:\\[^\x80-\xff][^\\\x80-\xff\n\015"]*)*")[\040\t]*(?:\([^\\\x80-\
xff\n\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff\n\015()]*(?:\\[^\x80
-\xff][^\\\x80-\xff\n\015()]*)*\))[^\\\x80-\xff\n\015()]*)*\)[\040\t]*
)*(?:\.[\040\t]*(?:\([^\\\x80-\xff\n\015()]*(?:(?:\\[^\x80-\xff]|\([^\
\\x80-\xff\n\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff\n\015()]*)*\))[^\\\
x80-\xff\n\015()]*)*\)[\040\t]*)*(?:[^(\040)<>@,;:".\\\[\]\000-\037\x8
0-\xff]+(?![^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff])|"[^\\\x80-\xff\n
\015"]*(?:\\[^\x80-\xff][^\\\x80-\xff\n\015"]*)*")[\040\t]*(?:\([^\\\x
80-\xff\n\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff\n\015()]*(?:\\[^
\x80-\xff][^\\\x80-\xff\n\015()]*)*\))[^\\\x80-\xff\n\015()]*)*\)[\040
\t]*)*)*@[\040\t]*(?:\([^\\\x80-\xff\n\015()]*(?:(?:\\[^\x80-\xff]|\([
^\\\x80-\xff\n\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff\n\015()]*)*\))[^\
\\x80-\xff\n\015()]*)*\)[\040\t]*)*(?:[^(\040)<>@,;:".\\\[\]\000-\037\
x80-\xff]+(?![^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff])|\[(?:[^\\\x80-
\xff\n\015\[\]]|\\[^\x80-\xff])*\])[\040\t]*(?:\([^\\\x80-\xff\n\015()
]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff\n\015()]*(?:\\[^\x80-\xff][^\\\
x80-\xff\n\015()]*)*\))[^\\\x80-\xff\n\015()]*)*\)[\040\t]*)*(?:\.[\04
0\t]*(?:\([^\\\x80-\xff\n\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff\
n\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff\n\015()]*)*\))[^\\\x80-\xff\n\
015()]*)*\)[\040\t]*)*(?:[^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff]+(?!
[^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff])|\[(?:[^\\\x80-\xff\n\015\[\
]]|\\[^\x80-\xff])*\])[\040\t]*(?:\([^\\\x80-\xff\n\015()]*(?:(?:\\[^\
x80-\xff]|\([^\\\x80-\xff\n\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff\n\01
5()]*)*\))[^\\\x80-\xff\n\015()]*)*\)[\040\t]*)*)*|(?:[^(\040)<>@,;:".
\\\[\]\000-\037\x80-\xff]+(?![^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff]
)|"[^\\\x80-\xff\n\015"]*(?:\\[^\x80-\xff][^\\\x80-\xff\n\015"]*)*")[^
()<>@,;:".\\\[\]\x80-\xff\000-\010\012-\037]*(?:(?:\([^\\\x80-\xff\n\0
15()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff\n\015()]*(?:\\[^\x80-\xff][
^\\\x80-\xff\n\015()]*)*\))[^\\\x80-\xff\n\015()]*)*\)|"[^\\\x80-\xff\
n\015"]*(?:\\[^\x80-\xff][^\\\x80-\xff\n\015"]*)*")[^()<>@,;:".\\\[\]\
x80-\xff\000-\010\012-\037]*)*<[\040\t]*(?:\([^\\\x80-\xff\n\015()]*(?
:(?:\\[^\x80-\xff]|\([^\\\x80-\xff\n\015()]*(?:\\[^\x80-\xff][^\\\x80-
\xff\n\015()]*)*\))[^\\\x80-\xff\n\015()]*)*\)[\040\t]*)*(?:@[\040\t]*
(?:\([^\\\x80-\xff\n\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff\n\015
()]*(?:\\[^\x80-\xff][^\\\x80-\xff\n\015()]*)*\))[^\\\x80-\xff\n\015()
]*)*\)[\040\t]*)*(?:[^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff]+(?![^(\0
40)<>@,;:".\\\[\]\000-\037\x80-\xff])|\[(?:[^\\\x80-\xff\n\015\[\]]|\\
[^\x80-\xff])*\])[\040\t]*(?:\([^\\\x80-\xff\n\015()]*(?:(?:\\[^\x80-\
xff]|\([^\\\x80-\xff\n\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff\n\015()]*
)*\))[^\\\x80-\xff\n\015()]*)*\)[\040\t]*)*(?:\.[\040\t]*(?:\([^\\\x80
-\xff\n\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff\n\015()]*(?:\\[^\x
80-\xff][^\\\x80-\xff\n\015()]*)*\))[^\\\x80-\xff\n\015()]*)*\)[\040\t
]*)*(?:[^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff]+(?![^(\040)<>@,;:".\\
\[\]\000-\037\x80-\xff])|\[(?:[^\\\x80-\xff\n\015\[\]]|\\[^\x80-\xff])
*\])[\040\t]*(?:\([^\\\x80-\xff\n\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x
80-\xff\n\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff\n\015()]*)*\))[^\\\x80
-\xff\n\015()]*)*\)[\040\t]*)*)*(?:,[\040\t]*(?:\([^\\\x80-\xff\n\015(
)]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff\n\015()]*(?:\\[^\x80-\xff][^\\
\x80-\xff\n\015()]*)*\))[^\\\x80-\xff\n\015()]*)*\)[\040\t]*)*@[\040\t
]*(?:\([^\\\x80-\xff\n\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff\n\0
15()]*(?:\\[^\x80-\xff][^\\\x80-\xff\n\015()]*)*\))[^\\\x80-\xff\n\015
()]*)*\)[\040\t]*)*(?:[^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff]+(?![^(
\040)<>@,;:".\\\[\]\000-\037\x80-\xff])|\[(?:[^\\\x80-\xff\n\015\[\]]|
\\[^\x80-\xff])*\])[\040\t]*(?:\([^\\\x80-\xff\n\015()]*(?:(?:\\[^\x80
-\xff]|\([^\\\x80-\xff\n\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff\n\015()
]*)*\))[^\\\x80-\xff\n\015()]*)*\)[\040\t]*)*(?:\.[\040\t]*(?:\([^\\\x
80-\xff\n\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff\n\015()]*(?:\\[^
\x80-\xff][^\\\x80-\xff\n\015()]*)*\))[^\\\x80-\xff\n\015()]*)*\)[\040
\t]*)*(?:[^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff]+(?![^(\040)<>@,;:".
\\\[\]\000-\037\x80-\xff])|\[(?:[^\\\x80-\xff\n\015\[\]]|\\[^\x80-\xff
])*\])[\040\t]*(?:\([^\\\x80-\xff\n\015()]*(?:(?:\\[^\x80-\xff]|\([^\\
\x80-\xff\n\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff\n\015()]*)*\))[^\\\x
80-\xff\n\015()]*)*\)[\040\t]*)*)*)*:[\040\t]*(?:\([^\\\x80-\xff\n\015
()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff\n\015()]*(?:\\[^\x80-\xff][^\
\\x80-\xff\n\015()]*)*\))[^\\\x80-\xff\n\015()]*)*\)[\040\t]*)*)?(?:[^
(\040)<>@,;:".\\\[\]\000-\037\x80-\xff]+(?![^(\040)<>@,;:".\\\[\]\000-
\037\x80-\xff])|"[^\\\x80-\xff\n\015"]*(?:\\[^\x80-\xff][^\\\x80-\xff\
n\015"]*)*")[\040\t]*(?:\([^\\\x80-\xff\n\015()]*(?:(?:\\[^\x80-\xff]|
\([^\\\x80-\xff\n\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff\n\015()]*)*\))
[^\\\x80-\xff\n\015()]*)*\)[\040\t]*)*(?:\.[\040\t]*(?:\([^\\\x80-\xff
\n\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff\n\015()]*(?:\\[^\x80-\x
ff][^\\\x80-\xff\n\015()]*)*\))[^\\\x80-\xff\n\015()]*)*\)[\040\t]*)*(
?:[^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff]+(?![^(\040)<>@,;:".\\\[\]\
000-\037\x80-\xff])|"[^\\\x80-\xff\n\015"]*(?:\\[^\x80-\xff][^\\\x80-\
xff\n\015"]*)*")[\040\t]*(?:\([^\\\x80-\xff\n\015()]*(?:(?:\\[^\x80-\x
ff]|\([^\\\x80-\xff\n\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff\n\015()]*)
*\))[^\\\x80-\xff\n\015()]*)*\)[\040\t]*)*)*@[\040\t]*(?:\([^\\\x80-\x
ff\n\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff\n\015()]*(?:\\[^\x80-
\xff][^\\\x80-\xff\n\015()]*)*\))[^\\\x80-\xff\n\015()]*)*\)[\040\t]*)
*(?:[^(\040)<>@,;:".\\\[\]\000-\037\x80-\xff]+(?![^(\040)<>@,;:".\\\[\
]\000-\037\x80-\xff])|\[(?:[^\\\x80-\xff\n\015\[\]]|\\[^\x80-\xff])*\]
)[\040\t]*(?:\([^\\\x80-\xff\n\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-
\xff\n\015()]*(?:\\[^\x80-\xff][^\\\x80-\xff\n\015()]*)*\))[^\\\x80-\x
ff\n\015()]*)*\)[\040\t]*)*(?:\.[\040\t]*(?:\([^\\\x80-\xff\n\015()]*(
?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff\n\015()]*(?:\\[^\x80-\xff][^\\\x80
-\xff\n\015()]*)*\))[^\\\x80-\xff\n\015()]*)*\)[\040\t]*)*(?:[^(\040)<
>@,;:".\\\[\]\000-\037\x80-\xff]+(?![^(\040)<>@,;:".\\\[\]\000-\037\x8
0-\xff])|\[(?:[^\\\x80-\xff\n\015\[\]]|\\[^\x80-\xff])*\])[\040\t]*(?:
\([^\\\x80-\xff\n\015()]*(?:(?:\\[^\x80-\xff]|\([^\\\x80-\xff\n\015()]
*(?:\\[^\x80-\xff][^\\\x80-\xff\n\015()]*)*\))[^\\\x80-\xff\n\015()]*)
*\)[\040\t]*)*)*>)
EOF
जैसा कि आप PHP में लिख रहे हैं, मैं आपको ईमेल के लिए PHP बिल्ड-सत्यापन का उपयोग करने की सलाह दूंगा।
filter_var($value, FILTER_VALIDATE_EMAIL)
यदि आप 5.3.6 से कम php-संस्करण चला रहे हैं, तो कृपया इस मुद्दे से अवगत रहें: https://bugs.php.net/bug.php?id=53091
यदि आप अधिक जानकारी चाहते हैं कि यह buid-in सत्यापन काम कैसे करता है, तो यहां देखें: क्या PHP का फ़िल्टर_वर FILTER_VALIDATE_EMAIL वास्तव में काम करता है?
कैल हेंडरसन (फ़्लिकर) ने पीएचपी में पार्सिंग ईमेल एड्रेसस नामक एक लेख लिखा और दिखाया कि उचित आरएफसी (2) 822-अनुरूप ईमेल पता पार्सिंग कैसे करें। आप php , अजगर और रूबी में स्रोत कोड भी प्राप्त कर सकते हैं जो कि cc लाइसेंस प्राप्त है ।
मैं अपनी नियमित अभिव्यक्ति के साथ कभी भी परेशान नहीं करता, क्योंकि संभावना है कि कोई और पहले से ही एक बेहतर संस्करण के साथ आया है। मैं हमेशा अपनी पसंद का एक खोजने के लिए regexlib का उपयोग करता हूं।
ऐसा कोई नहीं है जो वास्तव में प्रयोग करने योग्य हो।
मैं अपने जवाब में कुछ मुद्दों पर चर्चा करता हूं क्या ईमेल पते के सत्यापन के लिए php पुस्तकालय है? , यह Regexp ईमेल पते की पहचान में भी कठिन है?
संक्षेप में, उचित कार्य करने के लिए एकल, प्रयोग करने योग्य रेगेक्स की अपेक्षा न करें। और सबसे अच्छा रेगेक्स सिंटैक्स को मान्य करेगा, न कि ई-मेल की वैधता ([email protected] सही है लेकिन यह शायद उछाल देगा ...)।
एक साधारण नियमित अभिव्यक्ति जो कम से कम किसी भी वैध ईमेल पते को अस्वीकार नहीं करेगी, वह किसी चीज़ की जाँच कर रही होगी, उसके बाद एक @ चिन्ह और फिर कुछ अवधि और उसके बाद कम से कम 2 दिन। यह कुछ भी अस्वीकार नहीं करेगा, लेकिन कल्पना की समीक्षा के बाद मुझे ऐसा कोई ईमेल नहीं मिलेगा जो मान्य और अस्वीकृत हो।
ईमेल = ~ /.+@[^@]+\.[^@]{2,}$/
आप jQuery सत्यापन प्लगइन द्वारा नियोजित एक का उपयोग कर सकते हैं:
/^((([a-z]|\d|[!#\$%&'\*\+\-\/=\?\^_`{\|}~]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])+(\.([a-z]|\d|[!#\$%&'\*\+\-\/=\?\^_`{\|}~]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])+)*)|((\x22)((((\x20|\x09)*(\x0d\x0a))?(\x20|\x09)+)?(([\x01-\x08\x0b\x0c\x0e-\x1f\x7f]|\x21|[\x23-\x5b]|[\x5d-\x7e]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(\\([\x01-\x09\x0b\x0c\x0d-\x7f]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF]))))*(((\x20|\x09)*(\x0d\x0a))?(\x20|\x09)+)?(\x22)))@((([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])([a-z]|\d|-|\.|_|~|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])*([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])))\.)+(([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])([a-z]|\d|-|\.|_|~|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])*([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])))\.?$/i
ईमेल पते को मान्य करने के लिए सबसे अच्छी नियमित अभिव्यक्ति के सबसे व्यापक मूल्यांकन के लिए कृपया इस लिंक को देखें; " ई-मेल एड्रेस की तुलना रेगुलर एक्सप्रेशंस मान्य करना "
यहाँ संदर्भ उद्देश्यों के लिए वर्तमान शीर्ष अभिव्यक्ति है:
/^([\w\!\#$\%\&\'\*\+\-\/\=\?\^\`{\|\}\~]+\.)*[\w\!\#$\%\&\'\*\+\-\/\=\?\^\`{\|\}\~]+@((((([a-z0-9]{1}[a-z0-9\-]{0,62}[a-z0-9]{1})|[a-z])\.)+[a-z]{2,6})|(\d{1,3}\.){3}\d{1,3}(\:\d{1,5})?)$/i
निकट भविष्य में गैर-लैटिन (चीनी, अरबी, ग्रीक, हिब्रू, सिरिलिक और इतने पर) डोमेन नाम की अनुमति नहीं है । सभी को इस्तेमाल किए गए ईमेल रेगेक्स को बदलना होगा, क्योंकि उन पात्रों को निश्चित रूप से न तो कवर किया जाना है [a-z]/i
और न ही \w
। वे सब विफल हो जाएंगे।
आखिरकार, ईमेल पते को मान्य करने का सबसे अच्छा तरीका वास्तव में पते को मान्य करने के लिए प्रश्न में पते पर एक ईमेल भेजना है । यदि ईमेल पता उपयोगकर्ता प्रमाणीकरण (रजिस्टर / लॉगिन / आदि) का हिस्सा है, तो आप इसे उपयोगकर्ता सक्रियण प्रणाली के साथ पूरी तरह से जोड़ सकते हैं। यानी एक निर्दिष्ट ईमेल पते के लिए एक अद्वितीय सक्रियकरण कुंजी के साथ एक लिंक के साथ एक ईमेल भेजें और केवल लॉगिन की अनुमति दें जब उपयोगकर्ता ने ईमेल में लिंक का उपयोग करके नए बनाए गए खाते को सक्रिय किया हो।
यदि रेगेक्स का उद्देश्य यूआई में उपयोगकर्ता को जल्दी से सूचित करना है कि निर्दिष्ट ईमेल पता सही प्रारूप में नहीं दिखता है, तो सबसे अच्छा यह जांचना है कि क्या यह मूल रूप से निम्न रेगेक्स से मेल खाता है:
^([^.@]+)(\.[^.@]+)*@([^.@]+\.)+([^.@]+)$
इतना ही आसान। धरती पर आप नाम और डोमेन में इस्तेमाल होने वाले पात्रों की परवाह क्यों करेंगे? यह ग्राहक की जिम्मेदारी है कि वह वैध ईमेल पता दर्ज करे, न कि सर्वर का। यहां तक कि जब ग्राहक एक सिन्थेटिक रूप से मान्य ईमेल पते में प्रवेश [email protected]
करता है, तो यह गारंटी नहीं देता कि यह एक वैध ईमेल पता है। कोई भी रेगेक्स कवर नहीं कर सकता है।
एचटीएमएल 5 कल्पना का सुझाव ई-मेल पते को मान्य के लिए एक सरल regex:
/^[a-zA-Z0-9.!#$%&'*+\/=?^_`{|}~-]+@[a-zA-Z0-9](?:[a-zA-Z0-9-]{0,61}[a-zA-Z0-9])?(?:\.[a-zA-Z0-9](?:[a-zA-Z0-9-]{0,61}[a-zA-Z0-9])?)*$/
यह जानबूझकर RFC 5322 का अनुपालन नहीं करता है ।
नोट: यह आवश्यकता RFC 5322 का एक विलक्षण उल्लंघन है , जो ई-मेल पते के लिए एक वाक्यविन्यास को परिभाषित करता है जो एक साथ बहुत सख्त है ( चरित्र से पहले ), बहुत अस्पष्ट ( चरित्र के बाद ), और बहुत ढीला (टिप्पणियों, व्हाट्सएप वर्णों की अनुमति देता है) और अधिकांश उपयोगकर्ताओं के लिए अपरिचित लोगों में उद्धृत उद्धरण) यहां व्यावहारिक उपयोग के लिए।
@
@
कुल लंबाई 254 वर्ण, प्रति RFC 3696 इरेटा 1690 तक सीमित हो सकती है ।
एक ज्वलंत प्रदर्शन के लिए, निम्नलिखित राक्षस बहुत अच्छा है, लेकिन अभी भी सभी वाक्यात्मक रूप से मान्य ईमेल पतों को सही ढंग से नहीं पहचानता है: यह चार स्तरों तक गहरी नेस्टेड टिप्पणियों को पहचानता है।
यह एक पार्सर के लिए एक काम है, लेकिन भले ही कोई पता वाक्यगत रूप से मान्य हो, फिर भी यह वितरण योग्य नहीं हो सकता है। कभी-कभी आपको "अरे, येल, वॉच ई-यू!" की पहाड़ी पद्धति का सहारा लेना पड़ता है।
// derivative of work with the following copyright and license:
// Copyright (c) 2004 Casey West. All rights reserved.
// This module is free software; you can redistribute it and/or
// modify it under the same terms as Perl itself.
// see http://search.cpan.org/~cwest/Email-Address-1.80/
private static string gibberish = @"
(?-xism:(?:(?-xism:(?-xism:(?-xism:(?-xism:(?-xism:(?-xism:\
s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^
\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))
|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+)*\s*\)\s*))+)*\s*\)\s*)+
|\s+)*[^\x00-\x1F\x7F()<>\[\]:;@\,.<DQ>\s]+(?-xism:(?-xism:\
s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^
\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))
|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+)*\s*\)\s*))+)*\s*\)\s*)+
|\s+)*)|(?-xism:(?-xism:(?-xism:\s*\((?:\s*(?-xism:(?-xism:(
?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\((?
:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x
0D]))|)+)*\s*\)\s*))+)*\s*\)\s*)+|\s+)*<DQ>(?-xism:(?-xism:[
^\\<DQ>])|(?-xism:\\(?-xism:[^\x0A\x0D])))+<DQ>(?-xism:(?-xi
sm:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xis
m:[^\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\
]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+)*\s*\)\s*))+)*\s*\)\
s*)+|\s+)*))+)?(?-xism:(?-xism:(?-xism:\s*\((?:\s*(?-xism:(?
-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:
\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[
^\x0A\x0D]))|)+)*\s*\)\s*))+)*\s*\)\s*)+|\s+)*<(?-xism:(?-xi
sm:(?-xism:(?-xism:(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^(
)\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\((?:\s*(
?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))
|)+)*\s*\)\s*))+)*\s*\)\s*)+|\s+)*(?-xism:[^\x00-\x1F\x7F()<
>\[\]:;@\,.<DQ>\s]+(?:\.[^\x00-\x1F\x7F()<>\[\]:;@\,.<DQ>\s]
+)*)(?-xism:(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))
|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-xism:
(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+)*\s
*\)\s*))+)*\s*\)\s*)+|\s+)*)|(?-xism:(?-xism:(?-xism:\s*\((?
:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x
0D]))|(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xi
sm:\\(?-xism:[^\x0A\x0D]))|)+)*\s*\)\s*))+)*\s*\)\s*)+|\s+)*
<DQ>(?-xism:(?-xism:[^\\<DQ>])|(?-xism:\\(?-xism:[^\x0A\x0D]
)))+<DQ>(?-xism:(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\
]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-x
ism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+
)*\s*\)\s*))+)*\s*\)\s*)+|\s+)*))\@(?-xism:(?-xism:(?-xism:(
?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?
-xism:[^\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^
()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+)*\s*\)\s*))+)*\s
*\)\s*)+|\s+)*(?-xism:[^\x00-\x1F\x7F()<>\[\]:;@\,.<DQ>\s]+(
?:\.[^\x00-\x1F\x7F()<>\[\]:;@\,.<DQ>\s]+)*)(?-xism:(?-xism:
\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[
^\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+)
)|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+)*\s*\)\s*))+)*\s*\)\s*)
+|\s+)*)|(?-xism:(?-xism:(?-xism:\s*\((?:\s*(?-xism:(?-xism:
(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\((
?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\
x0D]))|)+)*\s*\)\s*))+)*\s*\)\s*)+|\s+)*\[(?:\s*(?-xism:(?-x
ism:[^\[\]\\])|(?-xism:\\(?-xism:[^\x0A\x0D])))+)*\s*\](?-xi
sm:(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:
\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-xism:(?-xism:(
?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+)*\s*\)\s*))+
)*\s*\)\s*)+|\s+)*)))>(?-xism:(?-xism:\s*\((?:\s*(?-xism:(?-
xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:\
s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^
\x0A\x0D]))|)+)*\s*\)\s*))+)*\s*\)\s*)+|\s+)*))|(?-xism:(?-x
ism:(?-xism:(?-xism:(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^
()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\((?:\s*
(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D])
)|)+)*\s*\)\s*))+)*\s*\)\s*)+|\s+)*(?-xism:[^\x00-\x1F\x7F()
<>\[\]:;@\,.<DQ>\s]+(?:\.[^\x00-\x1F\x7F()<>\[\]:;@\,.<DQ>\s
]+)*)(?-xism:(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+)
)|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-xism
:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+)*\
s*\)\s*))+)*\s*\)\s*)+|\s+)*)|(?-xism:(?-xism:(?-xism:\s*\((
?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\
x0D]))|(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-x
ism:\\(?-xism:[^\x0A\x0D]))|)+)*\s*\)\s*))+)*\s*\)\s*)+|\s+)
*<DQ>(?-xism:(?-xism:[^\\<DQ>])|(?-xism:\\(?-xism:[^\x0A\x0D
])))+<DQ>(?-xism:(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\
\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-
xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|)
+)*\s*\)\s*))+)*\s*\)\s*)+|\s+)*))\@(?-xism:(?-xism:(?-xism:
(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(
?-xism:[^\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[
^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+)*\s*\)\s*))+)*\
s*\)\s*)+|\s+)*(?-xism:[^\x00-\x1F\x7F()<>\[\]:;@\,.<DQ>\s]+
(?:\.[^\x00-\x1F\x7F()<>\[\]:;@\,.<DQ>\s]+)*)(?-xism:(?-xism
:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:
[^\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+
))|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+)*\s*\)\s*))+)*\s*\)\s*
)+|\s+)*)|(?-xism:(?-xism:(?-xism:\s*\((?:\s*(?-xism:(?-xism
:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\(
(?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A
\x0D]))|)+)*\s*\)\s*))+)*\s*\)\s*)+|\s+)*\[(?:\s*(?-xism:(?-
xism:[^\[\]\\])|(?-xism:\\(?-xism:[^\x0A\x0D])))+)*\s*\](?-x
ism:(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism
:\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\((?:\s*(?-xism:(?-xism:
(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|)+)*\s*\)\s*))
+)*\s*\)\s*)+|\s+)*))))(?-xism:\s*\((?:\s*(?-xism:(?-xism:(?
>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0D]))|(?-xism:\s*\((?:
\s*(?-xism:(?-xism:(?>[^()\\]+))|(?-xism:\\(?-xism:[^\x0A\x0
D]))|)+)*\s*\)\s*))+)*\s*\)\s*)*)"
.Replace("<DQ>", "\"")
.Replace("\t", "")
.Replace(" ", "")
.Replace("\r", "")
.Replace("\n", "");
private static Regex mailbox =
new Regex(gibberish, RegexOptions.ExplicitCapture);
आधिकारिक मानक RFC 2822 के अनुसार वैध ईमेल regex है
(?:[a-z0-9!#$%&'*+/=?^_`{|}~-]+(?:\.[a-z0-9!#$%&'*+/=?^_`{|}~-]+)*|"(?:[\x01-\x08\x0b\x0c\x0e-\x1f\x21\x23-\x5b\x5d-\x7f]|\\[\x01-\x09\x0b\x0c\x0e-\x7f])*")@(?:(?:[a-z0-9](?:[a-z0-9-]*[a-z0-9])?\.)+[a-z0-9](?:[a-z0-9-]*[a-z0-9])?|\[(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?|[a-z0-9-]*[a-z0-9]:(?:[\x01-\x08\x0b\x0c\x0e-\x1f\x21-\x5a\x53-\x7f]|\\[\x01-\x09\x0b\x0c\x0e-\x7f])+)\])
यदि आप इसे जावा में उपयोग करना चाहते हैं तो यह वास्तव में बहुत आसान है
import java.util.regex.*;
class regexSample
{
public static void main(String args[])
{
//Input the string for validation
String email = "[email protected]";
//Set the email pattern string
Pattern p = Pattern.compile(" (?:[a-z0-9!#$%&'*+/=?^_`{|}~-]+(?:\\.[a-z0-9!#$%&'*+/=?^_`{|}~-]+)*|"
+"(?:[\\x01-\\x08\\x0b\\x0c\\x0e-\\x1f\\x21\\x23-\\x5b\\x5d-\\x7f]|\\[\\x01-\\x09\\x0b\\x0c\\x0e-\\x7f])*\")"
+ "@(?:(?:[a-z0-9](?:[a-z0-9-]*[a-z0-9])?\\.)+[a-z0-9](?:[a-z0-9-]*[a-z0-9])?|\\[(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?|[a-z0-9-]*[a-z0-9]:(?:[\\x01-\\x08\\x0b\\x0c\\x0e-\\x1f\\x21-\\x5a\\x53-\\x7f]|\\[\\x01-\\x09\\x0b\\x0c\\x0e-\\x7f])+)\\]");
//Match the given string with the pattern
Matcher m = p.matcher(email);
//check whether match is found
boolean matchFound = m.matches();
if (matchFound)
System.out.println("Valid Email Id.");
else
System.out.println("Invalid Email Id.");
}
}
यहाँ PHP मैं उपयोग है। मैंने इस समाधान को "गलत सकारात्मकता की तुलना में झूठे नकारात्मक से बेहतर है" के रूप में चुना है, जैसा कि एक अन्य टिप्पणीकार ने यहां घोषित किया है और आपके प्रतिक्रिया समय और सर्वर लोड को कम रखने के संबंध में ... वास्तव में सर्वर संसाधनों को बर्बाद करने की कोई आवश्यकता नहीं है एक नियमित अभिव्यक्ति जब यह सबसे सरल उपयोगकर्ता त्रुटि को समाप्त कर देगा। यदि आप चाहें तो आप परीक्षण ईमेल भेजकर हमेशा इसका पालन कर सकते हैं।
function validateEmail($email) { return (bool) stripos($email,'@');
}
RFC 5322 मानक:
डॉट-एटम स्थानीय-भाग, उद्धृत-स्ट्रिंग स्थानीय-भाग, अप्रचलित (मिश्रित डॉट-एटम और उद्धृत-स्ट्रिंग) स्थानीय-भाग, डोमेन नाम डोमेन, (IPv4, IPv6, और IPv4- मैप्ड IPv4 पता) डोमेन शाब्दिक डोमेन की अनुमति देता है और (नेस्टेड) CFWS।
'/^(?!(?>(?1)"?(?>\\\[ -~]|[^"])"?(?1)){255,})(?!(?>(?1)"?(?>\\\[ -~]|[^"])"?(?1)){65,}@)((?>(?>(?>((?>(?>(?>\x0D\x0A)?[\t ])+|(?>[\t ]*\x0D\x0A)?[\t ]+)?)(\((?>(?2)(?>[\x01-\x08\x0B\x0C\x0E-\'*-\[\]-\x7F]|\\\[\x00-\x7F]|(?3)))*(?2)\)))+(?2))|(?2))?)([!#-\'*+\/-9=?^-~-]+|"(?>(?2)(?>[\x01-\x08\x0B\x0C\x0E-!#-\[\]-\x7F]|\\\[\x00-\x7F]))*(?2)")(?>(?1)\.(?1)(?4))*(?1)@(?!(?1)[a-z0-9-]{64,})(?1)(?>([a-z0-9](?>[a-z0-9-]*[a-z0-9])?)(?>(?1)\.(?!(?1)[a-z0-9-]{64,})(?1)(?5)){0,126}|\[(?:(?>IPv6:(?>([a-f0-9]{1,4})(?>:(?6)){7}|(?!(?:.*[a-f0-9][:\]]){8,})((?6)(?>:(?6)){0,6})?::(?7)?))|(?>(?>IPv6:(?>(?6)(?>:(?6)){5}:|(?!(?:.*[a-f0-9]:){6,})(?8)?::(?>((?6)(?>:(?6)){0,4}):)?))?(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(?>\.(?9)){3}))\])(?1)$/isD'
RFC 5321 मानक:
डॉट-एटम स्थानीय-भाग, उद्धृत-स्ट्रिंग स्थानीय-भाग, डोमेन नाम डोमेन, और (IPv4, IPv6, और IPv4-mapped IPv6 पता) डोमेन शाब्दिक डोमेन की अनुमति देता है।
'/^(?!(?>"?(?>\\\[ -~]|[^"])"?){255,})(?!"?(?>\\\[ -~]|[^"]){65,}"?@)(?>([!#-\'*+\/-9=?^-~-]+)(?>\.(?1))*|"(?>[ !#-\[\]-~]|\\\[ -~])*")@(?!.*[^.]{64,})(?>([a-z0-9](?>[a-z0-9-]*[a-z0-9])?)(?>\.(?2)){0,126}|\[(?:(?>IPv6:(?>([a-f0-9]{1,4})(?>:(?3)){7}|(?!(?:.*[a-f0-9][:\]]){8,})((?3)(?>:(?3)){0,6})?::(?4)?))|(?>(?>IPv6:(?>(?3)(?>:(?3)){5}:|(?!(?:.*[a-f0-9]:){6,})(?5)?::(?>((?3)(?>:(?3)){0,4}):)?))?(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(?>\.(?6)){3}))\])$/iD'
मूल:
डॉट-एटम लोकल-पार्ट और डोमेन नेम डोमेन को अनुमति देता है (टीएलडी के साथ कम से कम दो डोमेन नाम लेबल की आवश्यकता होती है जो 2-6 अल्फाबेटिक अक्षरों तक सीमित है)।
"/^(?!.{255,})(?!.{65,}@)([!#-'*+\/-9=?^-~-]+)(?>\.(?1))*@(?!.*[^.]{64,})(?>[a-z0-9](?>[a-z0-9-]*[a-z0-9])?\.){1,126}[a-z]{2,6}$/iD"
मैं थोड़ी देर के लिए आपके regex के इस छुआ हुआ संस्करण का उपयोग कर रहा हूं और इसने मुझे बहुत आश्चर्य के साथ नहीं छोड़ा है।
मैं एक ईमेल में एक apostrophe का सामना नहीं किया है अभी तक तो यह मान्य नहीं करता है
। इसे सत्यापित करने में करता है Jean+Franç[email protected]
और 试@例子.测试.مثال.آزمایشی
नहीं बल्कि उन गैर अक्षरांकीय अक्षर का अजीब दुरुपयोग [email protected]
।
(?!^[.+&'_-]*@.*$)(^[_\w\d+&'-]+(\.[_\w\d+&'-]*)*@[\w\d-]+(\.[\w\d-]+)*\.(([\d]{1,3})|([\w]{2,}))$)
यह IP पतों का समर्थन करता है [email protected]
लेकिन मैंने फर्जी IP श्रेणियों जैसे कि इससे निपटने के लिए इसे पर्याप्त रूप से परिष्कृत नहीं किया है 999.999.999.1
।
यह 3 अक्षरों से अधिक के सभी टीएलडी का भी समर्थन करता है जो रुक जाता है
मुझे हरा दिया गया है, अब 3 पात्रों पर बहुत अधिक टार हैं।[email protected]
जो मुझे लगता है कि मूल के माध्यम से चलो
मुझे पता है कि एक्रॉसमैन ने अपने रेगेक्स को छोड़ दिया है, लेकिन यह स्वाद पर रहता है।
यदि आप खाली मान (जो अमान्य ईमेल नहीं है) स्वीकार करने और PHP 5.2+ चला रहे हैं, तो मैं सुझाव दूंगा:
static public function checkEmail($email, $ignore_empty = false) {
if($ignore_empty && (is_null($email) || $email == '')) return true; return filter_var($email, FILTER_VALIDATE_EMAIL);
}