HTML5 - URL एनकोडिंग
URL एन्कोडिंग का अभिप्राय है URL के भीतर विशेष वर्णों या वर्णों का विशेष अर्थ के साथ अभ्यावेदन करना जो वेब ब्राउज़र और सर्वर द्वारा स्पष्ट और सार्वभौमिक रूप से स्वीकृत है। इन पात्रों में शामिल हैं -
ASCII control characters- अनियंत्रित वर्ण आमतौर पर आउटपुट नियंत्रण के लिए उपयोग किए जाते हैं। चरित्र में 00-1F हेक्स (0-31 दशमलव) और 7F (127 दशमलव) होता है। एक पूर्ण एन्कोडिंग तालिका नीचे दी गई है।
Non-ASCII control characters- ये ASCII वर्ण से परे वर्ण हैं जो 128 वर्ण हैं। यह सीमा आईएसओ-लैटिन वर्ण सेट का हिस्सा है और आईएसओ-लैटिन सेट 80-एफएफ हेक्स (128-255 दशमलव) के पूरे "शीर्ष आधे" को ncludes करता है। एक पूर्ण एन्कोडिंग तालिका नीचे दी गई है।
Reserved characters- ये डॉलर के चिन्ह, एम्परसेंड, प्लस, कॉमन, फॉरवर्ड स्लैश, कोलन, सेमी-कोलोन, बराबरी के साइन, प्रश्न चिह्न और "एट" सिंबल जैसे विशेष वर्ण हैं। इन सभी के URL के अंदर अलग-अलग अर्थ हो सकते हैं, इसलिए इनकोड करने की आवश्यकता है। एक पूर्ण एन्कोडिंग तालिका नीचे दी गई है।
Unsafe characters- ये स्पेस, कोटेशन मार्क्स, सिंबल से कम, सिंबल, पाउंड कैरेक्टर, प्रतिशत कैरेक्टर, लेफ्ट कर्ली ब्रेस, राइट कर्ली ब्रेस, पाइप, बैकस्लैश, कैरट, टिल्डे, लेफ्ट स्क्वायर ब्रैकेट, राइट राईट ब्रैकेट, ग्रेव एक्सेंट हैं। ये चरित्र विभिन्न कारणों से URL के भीतर गलत समझा जाने की संभावना को प्रस्तुत करते हैं। इन पात्रों को भी हमेशा एन्कोड किया जाना चाहिए। एक पूर्ण एन्कोडिंग तालिका नीचे दी गई है।
एन्कोडिंग संकेतन तीन वर्णों के साथ वांछित वर्ण को प्रतिस्थापित करता है: एक प्रतिशत चिह्न और दो हेक्साडेसिमल अंक जिनके ASCII वर्ण सेट में वर्ण की स्थिति के अनुरूप हैं।
उदाहरण
सबसे आम विशेष पात्रों में से एक अंतरिक्ष है। आप सीधे URL में स्थान नहीं लिख सकते हैं। वर्ण सेट में एक स्थान की स्थिति 20 हेक्साडेसिमल है। इसलिए आप सर्वर से अपना अनुरोध पारित करते समय एक स्थान पर% 20 का उपयोग कर सकते हैं।
http://www.example.com/new%20pricing.html
यह URL वास्तव में www.example.com से एक नया मूल्य निर्धारण नाम का एक दस्तावेज प्राप्त करता है
ASCII नियंत्रण वर्ण एन्कोडिंग
इसमें वर्ण श्रेणी 00-1F हेक्स (0-31 दशमलव) और 7F (127 दशमलव) के लिए एन्कोडिंग शामिल है
दशमलव | हेक्स मान | चरित्र | URL एनकोड |
---|---|---|---|
0 | 00 | % 00 | |
1 | 01 | % 01 | |
2 | 02 | % 02 | |
3 | 03 | % 03 | |
4 | 04 | % 04 | |
5 | 05 | % 05 | |
6 | 06 | % 06 | |
7 | 07 | % 07 | |
8 | 08 | बैकस्पेस | % 08 |
9 | 09 | टैब | % 09 |
10 | 0A | रेखा भरण | % 0A |
1 1 | 0b | % 0b | |
12 | 0C | % 0C | |
13 | 0 दि | कैरिज रिटर्न | % 0 d |
14 | 0E | % 0E | |
15 | 0f | % 0f | |
16 | 10 | 10% | |
17 | 1 1 | %1 1 | |
18 | 12 | % 12 | |
19 | 13 | % 13 | |
20 | 14 | % 14 | |
21 | 15 | % 15 | |
22 | 16 | % 16 | |
23 | 17 | 17% | |
24 | 18 | % 18 | |
25 | 19 | % 19 | |
26 | 1 क | % 1 क | |
27 | 1b | % 1b | |
28 | 1c | % 1c | |
29 | 1 दिन | % 1d | |
30 | 1e | % 1e | |
31 | 1f | % 1f | |
127 | 7f | % 7f |
गैर- ASCII नियंत्रण वर्ण एन्कोडिंग
इसमें आईएसओ-लैटिन सेट 80-एफएफ हेक्स (128-255 दशमलव) के पूरे "शीर्ष आधा" के लिए एन्कोडिंग शामिल है।
दशमलव | हेक्स मान | चरित्र | URL एनकोड |
---|---|---|---|
128 | 80 | ?? | 80% |
129 | 81 | ?? | % 81 |
130 | 82 | ?? | % 82 |
131 | 83 | ?? | 83% से |
132 | 84 | ?? | % 84 |
133 | 85 | ?? | 85% |
134 | 86 | ?? | 86% |
135 | 87 | ?? | % 87 |
136 | 88 | ?? | % 88 |
137 | 89 | ?? | % 89 |
138 | 8a | ?? | % 8a |
139 | 8b | ?? | % 8b |
140 | 8C | ?? | % 8C |
141 | 8 घ | ?? | %8 घ |
142 | 8e | ?? | % 8e |
143 | 8F | ?? | % 8F |
144 | 90 | ?? | 90% |
145 | 91 | ?? | % 91 |
146 | 92 | ?? | % 92 |
147 | 93 | ?? | % 93 |
148 | 94 | ?? | % 94 |
149 | 95 | ?? | 95% |
150 | 96 | ?? | % 96 |
151 | 97 | ?? | % 97 |
152 | 98 | ?? | % 98 |
153 | 99 | ?? | % 99 |
154 | 9a | ?? | % 9a |
155 | 9b | ?? | % 9b |
156 | 9 | ?? | % 9c |
157 | 9d | ?? | % 9d |
158 | 9e | ?? | % 9e |
159 | 9 फ | ?? | % 9 फ |
160 | a0 | % a0 | |
161 | ए 1 | ¡ | % a1 |
162 | a2 | ¢ | % a2 |
163 | a3 | £ | % a3 |
164 | ए 4 | ¤ | % ए 4 |
165 | a5 | ¥ | % a5 |
166 | ए 6 | | | % ए 6 |
167 | a7 | § | % a7 |
168 | A8 | ¨ | % A8 |
169 | a9 | © | % A9 |
170 | आ | ª | % आ |
171 | अब | « | % अब |
172 | एसी | ¬ | %एसी |
173 | विज्ञापन | | % विज्ञापन |
174 | ऐ | ® | % ae |
175 | ए एफ | ¯ | %ए एफ |
176 | B0 | ° | % B0 |
177 | बी 1 | ± | % B1 |
178 | b2 | ² | % b2 |
179 | बी 3 | ³ | % बी 3 |
180 | बी 4 | ' | %बी 4 |
181 | B5 | μ | % B5 |
182 | बी -6 | ¶ | % बी -6 |
183 | बी 7 | · | % B7 |
184 | B8 | ¸ | % B8 |
185 | B9 | ¹ | % B9 |
186 | बी 0 ए | º | %बी 0 ए |
187 | बी बी | » | % bb |
188 | बीसी | ¼ | % bc |
189 | bd | साढ़े | % bd |
190 | होना | ¾ | % हो |
191 | BF के | ¿ | % BF के |
192 | c0 | ए | % c0 |
193 | सी 1 | ए | % C1 |
194 | c2 | ए | % C2 |
195 | सी 3 | ए | % C3 |
196 | सी 4 | ए | % C4 |
197 | सी 5 | ए | % C5 |
198 | सी 6 | Æ | % v6 |
199 | सी 7 | सी | % C7 |
200 | सी 8 | इ | % C8 |
201 | C9 | इ | % C9 |
202 | सीए | इ | %सीए |
203 | सीबी | इ | % सीबी |
204 | सीसी | मैं | % सीसी |
205 | सीडी | मैं | % सीडी |
206 | ce | मैं | % ce |
207 | सीएफ़ | मैं | % सीएफ |
208 | D0 | Ð | % D0 |
209 | d1 | Ñ | % डी 1 |
210 | d2 | हे | % d2 |
211 | d3 | Ó | % d3 |
212 | d4 | Ô | % d4 |
213 | d5 | हे | % d5 |
214 | d6 | Ö | % d6 |
215 | d7 | × | % d7 |
216 | d8 | Ø | % d8 |
217 | d9 | यू | % d9 |
218 | दा | U के | % दा |
219 | डाटाबेस | यू | % db |
220 | डीसी | Ü | % डीसी |
221 | डीडी | Ý | % dd |
222 | डे | Þ | %डे |
223 | df | ß | % df |
224 | E0 | ए | % E0 |
225 | ई 1 | ए | % E1 |
226 | e2 | ए | % e2 |
227 | E3 | ए | % E3 |
228 | ई 4 | ए | %ई 4 |
229 | E5 | ए | % E5 |
230 | E6 | æ | % E6 |
231 | E7 | सी | % E7 |
232 | e8 | इ | % e8 |
233 | E9 | इ | % E9 |
234 | ईए | इ | % ईए |
235 | ईबी | इ | % EB |
236 | चुनाव आयोग | मैं | % ec |
237 | ईडी | मैं | %ईडी |
238 | ee | मैं | % ee |
239 | एफई | मैं | % एफई |
240 | f0 | ð | % f0 |
241 | f1 | ñ | % f1 |
242 | f2 | हे | % f2 |
243 | f3 | ó | % f3 |
244 | F4 | ô | % F4 |
245 | F5 | हे | % F5 |
246 | F6 | ö | % F6 |
247 | F7 | ÷ | % F7 |
248 | F8 | ø | % F8 |
249 | F9 | यू | % F9 |
250 | पिता | U के | % पिता |
251 | अमेरिकन प्लान | यू | % अमेरिकन प्लान |
252 | एफसी | ü | % एफसी |
253 | fd | ý | % fd |
254 | फ़े | Þ | % फ़े |
255 | सीमांत बल | Ÿ | % एफएफ |
आरक्षित वर्ण एन्कोडिंग
आरक्षित वर्णों को एनकोड करने के लिए उपयोग की जाने वाली तालिका निम्नलिखित है।
दशमलव | हेक्स मान | चार | URL एनकोड |
---|---|---|---|
36 | 24 | $ | % 24 |
38 | 26 | और | % 26 |
43 | 2 बी | + | % 2 बी |
44 | 2c | , | % 2c |
47 | 2f | / | % 2f |
58 | 3 ए | : | % 3a |
59 | 3 बी | ; | % 3 बी |
61 | 3 डी | = | % 3d |
63 | 3F | ? | % 3F |
64 | 40 | @ | 40% |
असुरक्षित वर्ण एन्कोडिंग
असुरक्षित वर्णों को एनकोड करने के लिए उपयोग की जाने वाली तालिका निम्नलिखित है।
दशमलव | हेक्स मान | चार | URL एनकोड |
---|---|---|---|
32 | 20 | अंतरिक्ष | 20% |
34 | 22 | " | % 22 |
60 | -3 सी | < | % 3c |
62 | 3E | > | % 3E |
35 | 23 | # | % 23 |
37 | 25 | % | % 25 |
123 | 7 बी | { | % 7b |
125 | 7 दिन | } | % 7 दिन |
124 | 7c | | | % 7c |
92 | 5c | \ | % 5c |
94 | 5e | ^ | % 5e |
126 | 7e | ~ | % 7e |
91 | 5 ब | [ | % 5 ब |
93 | 5 डी | ] | % 5 डी |
96 | 60 | ` | 60% |