स्क्रैपी - टेलनेट कंसोल

विवरण

टेलनेट कंसोल एक पायथन शेल है जो स्क्रेपी प्रक्रिया के अंदर चलता है और इसका उपयोग स्क्रेपी चल रही प्रक्रिया के निरीक्षण और नियंत्रण के लिए किया जाता है।

एक्सेस टेलनेट कंसोल

निम्नलिखित कमांड का उपयोग करके टेलनेट कंसोल को एक्सेस किया जा सकता है -

telnet localhost 6023

मूल रूप से, टेलनेट कंसोल को टीसीपी पोर्ट में सूचीबद्ध किया गया है, जिसमें वर्णित है TELNETCONSOLE_PORT समायोजन।

चर

निम्न तालिका में दिए गए कुछ डिफ़ॉल्ट चर शॉर्टकट के रूप में उपयोग किए जाते हैं -

अनु क्रमांक शॉर्टकट और विवरण
1

crawler

यह स्क्रेपी क्रॉलर (scrapy.crawler.Crawler) ऑब्जेक्ट को संदर्भित करता है।

2

engine

यह Crawler.engine विशेषता को संदर्भित करता है।

3

spider

यह मकड़ी को संदर्भित करता है जो सक्रिय है।

4

slot

यह इंजन स्लॉट को संदर्भित करता है।

5

extensions

यह एक्सटेंशन मैनेजर (Crawler.extensions) विशेषता को संदर्भित करता है।

6

stats

यह आँकड़े कलेक्टर (क्रॉलर.स्टैट) विशेषता को संदर्भित करता है।

7

setting

यह स्क्रेपी सेटिंग्स ऑब्जेक्ट (Crawler.settings) विशेषता को संदर्भित करता है।

8

est

यह इंजन की स्थिति की एक रिपोर्ट मुद्रित करने के लिए संदर्भित करता है।

9

prefs

यह डिबगिंग के लिए मेमोरी को संदर्भित करता है।

10

p

यह pprint.pprint फ़ंक्शन के शॉर्टकट को संदर्भित करता है ।

1 1

hpy

यह मेमोरी डिबगिंग को संदर्भित करता है।

उदाहरण

टेलनेट कंसोल का उपयोग करके कुछ उदाहरण दिए गए हैं।

रोकें, फिर से शुरू करें और बकवास इंजन बंद करें

स्क्रेपी इंजन को रोकने के लिए, निम्नलिखित कमांड का उपयोग करें -

telnet localhost 6023
>>> engine.pause()
>>>

स्क्रैपी इंजन को फिर से शुरू करने के लिए, निम्नलिखित कमांड का उपयोग करें -

telnet localhost 6023
>>> engine.unpause()
>>>

स्क्रेपी इंजन को रोकने के लिए, निम्नलिखित कमांड का उपयोग करें -

telnet localhost 6023
>>> engine.stop()
Connection closed by foreign host.

इंजन की स्थिति देखें

टेलनेट कंसोल का उपयोग करता है est() निम्नलिखित कोड में दिखाए अनुसार स्क्रैप इंजन की स्थिति की जांच करने की विधि -

telnet localhost 6023
>>> est()
Execution engine status

time()-engine.start_time                        : 8.62972998619
engine.has_capacity()                           : False
len(engine.downloader.active)                   : 16
engine.scraper.is_idle()                        : False
engine.spider.name                              : followall
engine.spider_is_idle(engine.spider)            : False
engine.slot.closing                             : False
len(engine.slot.inprogress)                     : 16
len(engine.slot.scheduler.dqs or [])            : 0
len(engine.slot.scheduler.mqs)                  : 92
len(engine.scraper.slot.queue)                  : 0
len(engine.scraper.slot.active)                 : 0
engine.scraper.slot.active_size                 : 0
engine.scraper.slot.itemproc_size               : 0
engine.scraper.slot.needs_backout()             : False

टेलनेट कंसोल सिग्नल

आप टेलनेट स्थानीय नाम स्थान में चर जोड़ने, अपडेट करने या हटाने के लिए टेलनेट कंसोल सिग्नल का उपयोग कर सकते हैं। इस क्रिया को करने के लिए, आपको अपने हैंडलर में telnet_vars को तानाशाही से जोड़ना होगा।

scrapy.extensions.telnet.update_telnet_vars(telnet_vars)

पैरामीटर -

telnet_vars (dict)

जहाँ, डिक्टेट एक शब्दकोष होता है जिसमें टेलनेट वैरिएबल होते हैं।

टेलनेट सेटिंग्स

निम्न तालिका उन सेटिंग्स को दिखाती है जो टेलनेट कंसोल के व्यवहार को नियंत्रित करती हैं -

अनु क्रमांक सेटिंग्स और विवरण डिफ़ॉल्ट मान
1

TELNETCONSOLE_PORT

यह टेलनेट कंसोल के लिए पोर्ट रेंज को संदर्भित करता है। यदि यह किसी के लिए सेट नहीं है, तो पोर्ट को गतिशील रूप से सौंपा जाएगा।

[6023, 6073]
2

TELNETCONSOLE_HOST

यह उस इंटरफ़ेस को संदर्भित करता है जिस पर टेलनेट कंसोल को सुनना चाहिए।

'127.0.0.1'