HTML5 - URL एनकोडिंग

URL एन्कोडिंग का अभिप्राय है URL के भीतर विशेष वर्णों या वर्णों का विशेष अर्थ के साथ अभ्यावेदन करना जो वेब ब्राउज़र और सर्वर द्वारा स्पष्ट और सार्वभौमिक रूप से स्वीकृत है। इन पात्रों में शामिल हैं -

  • ASCII control characters- अनियंत्रित वर्ण आमतौर पर आउटपुट नियंत्रण के लिए उपयोग किए जाते हैं। चरित्र में 00-1F हेक्स (0-31 दशमलव) और 7F (127 दशमलव) होता है। एक पूर्ण एन्कोडिंग तालिका नीचे दी गई है।

  • Non-ASCII control characters- ये ASCII वर्ण से परे वर्ण हैं जो 128 वर्ण हैं। यह सीमा आईएसओ-लैटिन वर्ण सेट का हिस्सा है और आईएसओ-लैटिन सेट 80-एफएफ हेक्स (128-255 दशमलव) के पूरे "शीर्ष आधे" को ncludes करता है। एक पूर्ण एन्कोडिंग तालिका नीचे दी गई है।

  • Reserved characters- ये डॉलर के चिन्ह, एम्परसेंड, प्लस, कॉमन, फॉरवर्ड स्लैश, कोलन, सेमी-कोलोन, बराबरी के साइन, प्रश्न चिह्न और "एट" सिंबल जैसे विशेष वर्ण हैं। इन सभी के URL के अंदर अलग-अलग अर्थ हो सकते हैं, इसलिए इनकोड करने की आवश्यकता है। एक पूर्ण एन्कोडिंग तालिका नीचे दी गई है।

  • Unsafe characters- ये स्पेस, कोटेशन मार्क्स, सिंबल से कम, सिंबल, पाउंड कैरेक्टर, प्रतिशत कैरेक्टर, लेफ्ट कर्ली ब्रेस, राइट कर्ली ब्रेस, पाइप, बैकस्लैश, कैरट, टिल्डे, लेफ्ट स्क्वायर ब्रैकेट, राइट राईट ब्रैकेट, ग्रेव एक्सेंट हैं। ये चरित्र विभिन्न कारणों से URL के भीतर गलत समझा जाने की संभावना को प्रस्तुत करते हैं। इन पात्रों को भी हमेशा एन्कोड किया जाना चाहिए। एक पूर्ण एन्कोडिंग तालिका नीचे दी गई है।

एन्कोडिंग संकेतन तीन वर्णों के साथ वांछित वर्ण को प्रतिस्थापित करता है: एक प्रतिशत चिह्न और दो हेक्साडेसिमल अंक जिनके ASCII वर्ण सेट में वर्ण की स्थिति के अनुरूप हैं।

उदाहरण

सबसे आम विशेष पात्रों में से एक अंतरिक्ष है। आप सीधे URL में स्थान नहीं लिख सकते हैं। वर्ण सेट में एक स्थान की स्थिति 20 हेक्साडेसिमल है। इसलिए आप सर्वर से अपना अनुरोध पारित करते समय एक स्थान पर% 20 का उपयोग कर सकते हैं।

http://www.example.com/new%20pricing.html

यह URL वास्तव में www.example.com से एक नया मूल्य निर्धारण नाम का एक दस्तावेज प्राप्त करता है

ASCII नियंत्रण वर्ण एन्कोडिंग

इसमें वर्ण श्रेणी 00-1F हेक्स (0-31 दशमलव) और 7F (127 दशमलव) के लिए एन्कोडिंग शामिल है

दशमलव हेक्स मान चरित्र URL एनकोड
0 00   % 00
1 01   % 01
2 02   % 02
3 03   % 03
4 04   % 04
5 05   % 05
6 06   % 06
7 07   % 07
8 08 बैकस्पेस % 08
9 09 टैब % 09
10 0A रेखा भरण % 0A
1 1 0b   % 0b
12 0C   % 0C
13 0 दि कैरिज रिटर्न % 0 d
14 0E   % 0E
15 0f   % 0f
16 10   10%
17 1 1   %1 1
18 12   % 12
19 13   % 13
20 14   % 14
21 15   % 15
22 16   % 16
23 17   17%
24 18   % 18
25 19   % 19
26 1 क   % 1 क
27 1b   % 1b
28 1c   % 1c
29 1 दिन   % 1d
30 1e   % 1e
31 1f   % 1f
127 7f   % 7f

गैर- ASCII नियंत्रण वर्ण एन्कोडिंग

इसमें आईएसओ-लैटिन सेट 80-एफएफ हेक्स (128-255 दशमलव) के पूरे "शीर्ष आधा" के लिए एन्कोडिंग शामिल है।

दशमलव हेक्स मान चरित्र URL एनकोड
128 80 ?? 80%
129 81 ?? % 81
130 82 ?? % 82
131 83 ?? 83% से
132 84 ?? % 84
133 85 ?? 85%
134 86 ?? 86%
135 87 ?? % 87
136 88 ?? % 88
137 89 ?? % 89
138 8a ?? % 8a
139 8b ?? % 8b
140 8C ?? % 8C
141 8 घ ?? %8 घ
142 8e ?? % 8e
143 8F ?? % 8F
144 90 ?? 90%
145 91 ?? % 91
146 92 ?? % 92
147 93 ?? % 93
148 94 ?? % 94
149 95 ?? 95%
150 96 ?? % 96
151 97 ?? % 97
152 98 ?? % 98
153 99 ?? % 99
154 9a ?? % 9a
155 9b ?? % 9b
156 9 ?? % 9c
157 9d ?? % 9d
158 9e ?? % 9e
159 9 फ ?? % 9 फ
160 a0   % a0
161 ए 1 ¡ % a1
162 a2 ¢ % a2
163 a3 £ % a3
164 ए 4 ¤ % ए 4
165 a5 ¥ % a5
166 ए 6 | % ए 6
167 a7 § % a7
168 A8 ¨ % A8
169 a9 © % A9
170 ª % आ
171 अब « % अब
172 एसी ¬ %एसी
173 विज्ञापन ­ % विज्ञापन
174 ® % ae
175 ए एफ ¯ %ए एफ
176 B0 ° % B0
177 बी 1 ± % B1
178 b2 ² % b2
179 बी 3 ³ % बी 3
180 बी 4 ' %बी 4
181 B5 μ % B5
182 बी -6 % बी -6
183 बी 7 · % B7
184 B8 ¸ % B8
185 B9 ¹ % B9
186 बी 0 ए º %बी 0 ए
187 बी बी » % bb
188 बीसी ¼ % bc
189 bd साढ़े % bd
190 होना ¾ % हो
191 BF के ¿ % BF के
192 c0 % c0
193 सी 1 % C1
194 c2 % C2
195 सी 3 % C3
196 सी 4 % C4
197 सी 5 % C5
198 सी 6 Æ % v6
199 सी 7 सी % C7
200 सी 8 % C8
201 C9 % C9
202 सीए %सीए
203 सीबी % सीबी
204 सीसी मैं % सीसी
205 सीडी मैं % सीडी
206 ce मैं % ce
207 सीएफ़ मैं % सीएफ
208 D0 Ð % D0
209 d1 Ñ % डी 1
210 d2 हे % d2
211 d3 Ó % d3
212 d4 Ô % d4
213 d5 हे % d5
214 d6 Ö % d6
215 d7 × % d7
216 d8 Ø % d8
217 d9 यू % d9
218 दा U के % दा
219 डाटाबेस यू % db
220 डीसी Ü % डीसी
221 डीडी Ý % dd
222 डे Þ %डे
223 df ß % df
224 E0 % E0
225 ई 1 % E1
226 e2 % e2
227 E3 % E3
228 ई 4 %ई 4
229 E5 % E5
230 E6 æ % E6
231 E7 सी % E7
232 e8 % e8
233 E9 % E9
234 ईए % ईए
235 ईबी % EB
236 चुनाव आयोग मैं % ec
237 ईडी मैं %ईडी
238 ee मैं % ee
239 एफई मैं % एफई
240 f0 ð % f0
241 f1 ñ % f1
242 f2 हे % f2
243 f3 ó % f3
244 F4 ô % F4
245 F5 हे % F5
246 F6 ö % F6
247 F7 ÷ % F7
248 F8 ø % F8
249 F9 यू % F9
250 पिता U के % पिता
251 अमेरिकन प्लान यू % अमेरिकन प्लान
252 एफसी ü % एफसी
253 fd ý % fd
254 फ़े Þ % फ़े
255 सीमांत बल Ÿ % एफएफ

आरक्षित वर्ण एन्कोडिंग

आरक्षित वर्णों को एनकोड करने के लिए उपयोग की जाने वाली तालिका निम्नलिखित है।

दशमलव हेक्स मान चार URL एनकोड
36 24 $ % 24
38 26 और % 26
43 2 बी + % 2 बी
44 2c , % 2c
47 2f / % 2f
58 3 ए : % 3a
59 3 बी ; % 3 बी
61 3 डी = % 3d
63 3F ? % 3F
64 40 @ 40%

असुरक्षित वर्ण एन्कोडिंग

असुरक्षित वर्णों को एनकोड करने के लिए उपयोग की जाने वाली तालिका निम्नलिखित है।

दशमलव हेक्स मान चार URL एनकोड
32 20 अंतरिक्ष 20%
34 22 " % 22
60 -3 सी < % 3c
62 3E > % 3E
35 23 # % 23
37 25 % % 25
123 7 बी { % 7b
125 7 दिन } % 7 दिन
124 7c | % 7c
92 5c \ % 5c
94 5e ^ % 5e
126 7e ~ % 7e
91 5 ब [ % 5 ब
93 5 डी ] % 5 डी
96 60 ` 60%