स्क्रैपी - टेलनेट कंसोल
विवरण
टेलनेट कंसोल एक पायथन शेल है जो स्क्रेपी प्रक्रिया के अंदर चलता है और इसका उपयोग स्क्रेपी चल रही प्रक्रिया के निरीक्षण और नियंत्रण के लिए किया जाता है।
एक्सेस टेलनेट कंसोल
निम्नलिखित कमांड का उपयोग करके टेलनेट कंसोल को एक्सेस किया जा सकता है -
telnet localhost 6023
मूल रूप से, टेलनेट कंसोल को टीसीपी पोर्ट में सूचीबद्ध किया गया है, जिसमें वर्णित है TELNETCONSOLE_PORT समायोजन।
चर
निम्न तालिका में दिए गए कुछ डिफ़ॉल्ट चर शॉर्टकट के रूप में उपयोग किए जाते हैं -
अनु क्रमांक | शॉर्टकट और विवरण |
---|---|
1 | crawler यह स्क्रेपी क्रॉलर (scrapy.crawler.Crawler) ऑब्जेक्ट को संदर्भित करता है। |
2 | engine यह Crawler.engine विशेषता को संदर्भित करता है। |
3 | spider यह मकड़ी को संदर्भित करता है जो सक्रिय है। |
4 | slot यह इंजन स्लॉट को संदर्भित करता है। |
5 | extensions यह एक्सटेंशन मैनेजर (Crawler.extensions) विशेषता को संदर्भित करता है। |
6 | stats यह आँकड़े कलेक्टर (क्रॉलर.स्टैट) विशेषता को संदर्भित करता है। |
7 | setting यह स्क्रेपी सेटिंग्स ऑब्जेक्ट (Crawler.settings) विशेषता को संदर्भित करता है। |
8 | est यह इंजन की स्थिति की एक रिपोर्ट मुद्रित करने के लिए संदर्भित करता है। |
9 | prefs यह डिबगिंग के लिए मेमोरी को संदर्भित करता है। |
10 | p यह pprint.pprint फ़ंक्शन के शॉर्टकट को संदर्भित करता है । |
1 1 | hpy यह मेमोरी डिबगिंग को संदर्भित करता है। |
उदाहरण
टेलनेट कंसोल का उपयोग करके कुछ उदाहरण दिए गए हैं।
रोकें, फिर से शुरू करें और बकवास इंजन बंद करें
स्क्रेपी इंजन को रोकने के लिए, निम्नलिखित कमांड का उपयोग करें -
telnet localhost 6023
>>> engine.pause()
>>>
स्क्रैपी इंजन को फिर से शुरू करने के लिए, निम्नलिखित कमांड का उपयोग करें -
telnet localhost 6023
>>> engine.unpause()
>>>
स्क्रेपी इंजन को रोकने के लिए, निम्नलिखित कमांड का उपयोग करें -
telnet localhost 6023
>>> engine.stop()
Connection closed by foreign host.
इंजन की स्थिति देखें
टेलनेट कंसोल का उपयोग करता है est() निम्नलिखित कोड में दिखाए अनुसार स्क्रैप इंजन की स्थिति की जांच करने की विधि -
telnet localhost 6023
>>> est()
Execution engine status
time()-engine.start_time : 8.62972998619
engine.has_capacity() : False
len(engine.downloader.active) : 16
engine.scraper.is_idle() : False
engine.spider.name : followall
engine.spider_is_idle(engine.spider) : False
engine.slot.closing : False
len(engine.slot.inprogress) : 16
len(engine.slot.scheduler.dqs or []) : 0
len(engine.slot.scheduler.mqs) : 92
len(engine.scraper.slot.queue) : 0
len(engine.scraper.slot.active) : 0
engine.scraper.slot.active_size : 0
engine.scraper.slot.itemproc_size : 0
engine.scraper.slot.needs_backout() : False
टेलनेट कंसोल सिग्नल
आप टेलनेट स्थानीय नाम स्थान में चर जोड़ने, अपडेट करने या हटाने के लिए टेलनेट कंसोल सिग्नल का उपयोग कर सकते हैं। इस क्रिया को करने के लिए, आपको अपने हैंडलर में telnet_vars को तानाशाही से जोड़ना होगा।
scrapy.extensions.telnet.update_telnet_vars(telnet_vars)
पैरामीटर -
telnet_vars (dict)
जहाँ, डिक्टेट एक शब्दकोष होता है जिसमें टेलनेट वैरिएबल होते हैं।
टेलनेट सेटिंग्स
निम्न तालिका उन सेटिंग्स को दिखाती है जो टेलनेट कंसोल के व्यवहार को नियंत्रित करती हैं -
अनु क्रमांक | सेटिंग्स और विवरण | डिफ़ॉल्ट मान |
---|---|---|
1 | TELNETCONSOLE_PORT यह टेलनेट कंसोल के लिए पोर्ट रेंज को संदर्भित करता है। यदि यह किसी के लिए सेट नहीं है, तो पोर्ट को गतिशील रूप से सौंपा जाएगा। |
[6023, 6073] |
2 | TELNETCONSOLE_HOST यह उस इंटरफ़ेस को संदर्भित करता है जिस पर टेलनेट कंसोल को सुनना चाहिए। |
'127.0.0.1' |